概要
本ツールは、Shift_JIS(または EUC-JP)で書かれた日本語の HTML・テキストファイルを、
自動的に UTF-8 へ変換するブラウザ上で動作するWebアプリケーションです。
古いHTMLファイルには Shift_JIS エンコードのものが多く存在します。
これらをモダンな環境で正しく扱うには UTF-8 への変換が必要ですが、本ツールを使えば
ドラッグ&ドロップで複数ファイルを一括変換することができます。
変換処理はすべてブラウザ内で完結するため、ファイルがサーバーに送信されることはありません。
主な機能
encoding-japanese ライブラリを使い、Shift_JIS / EUC-JP / UTF-8 などを自動判定して一覧に表示します。
上限なく複数ファイルを同時にドロップ可能。1クリックですべてを順次変換・ダウンロードします。
古い HTML 4.01 形式の DOCTYPE を、現代標準の <!DOCTYPE html> に自動書き換えます。
旧形式の Content-Type meta タグを <meta charset="UTF-8"> に変換します。
すべての処理はブラウザ内のみで完結。ファイルは外部に一切送信されません。
プログレスバーと統計カードで変換状況をリアルタイム表示。エラーも即座に確認できます。
使い方
変換したいHTMLやテキストファイルを、ドロップゾーンへドラッグ&ドロップします。 または「📁 ファイルを選択」ボタンをクリックしてファイル選択ダイアログを開きます。 複数ファイルを一度に選択・ドロップすることが可能です。
読み込んだファイルの一覧が表示され、各ファイルの文字コードが自動検出されます。 Shift_JIS と表示されたファイルが変換対象です。 UTF-8 のファイルはそのまま出力されます。
「⚡ すべて UTF-8 に変換してダウンロード」ボタンをクリックします。
ファイルは1つずつ処理され、変換完了したものから自動的にダウンロードされます。
出力ファイル名は 元のファイル名_utf8.html となります。
すべての処理が完了すると統計カードに件数が表示されます。 エラーが発生したファイルは赤色で表示されます。 「クリア」ボタンで一覧をリセットし、次のファイルセットを処理できます。
変換内容の詳細
変換時にファイルの内容に対して以下の書き換えが自動的に行われます。
| # | 変換前(旧形式) | 変換後(新形式) | 説明 |
|---|---|---|---|
| ① | <!DOCTYPE HTML PUBLIC "-//W3C//..."> | <!DOCTYPE html> | HTML 4.01 / XHTML の DOCTYPE 宣言を HTML5 形式に統一 |
| ② | <meta http-equiv="Content-Type" content="text/html; charset=Shift_JIS"> | <meta charset="UTF-8"> | 旧形式の Content-Type メタタグを HTML5 の簡略形式に変換 |
| ③ | charset=Shift_JIS | charset="UTF-8" | 残存する charset 属性値を UTF-8 に書き換え |
| ④ | (charset 宣言なし) | <meta charset="UTF-8"> を <head> 直後に挿入 | charset 宣言がない HTML ファイルへの自動補完 |
| ⑤ | EUC-JP エンコードのファイル | UTF-8 に変換 + メタタグ修正 | EUC-JP 形式も Shift_JIS 同様に変換対象 |
変換例:HTML ファイルの場合
動作仕様
| 動作環境 | モダンブラウザ(Chrome / Firefox / Edge / Safari) |
| サーバー要件 | 不要(HTMLファイルをブラウザで開くだけで動作) |
| 対応入力形式 | .html, .htm, .txt, .css, .js, .xml, .csv, .json |
| 対応入力エンコード | Shift_JIS, EUC-JP, UTF-8 およびその他の encoding-japanese 検出可能形式 |
| 出力エンコード | UTF-8(BOMなし) |
| 同時処理ファイル数 | 上限なし(ブラウザのメモリに依存) |
| 出力ファイル名 | 元ファイル名_utf8.拡張子 |
| 使用ライブラリ | encoding-japanese v2.1.0(CDN) |
| 外部通信 | Google Fonts(フォント読み込みのみ)、ファイルデータの外部送信なし |
注意事項
変換後のファイルは元のファイルを上書きしません(別名で保存)が、 変換内容は自動処理のため、重要なファイルは事前に必ずオリジナルを保管してください。
文字コードの自動検出が誤った場合、文字化けが発生することがあります。 この場合は別のブラウザやツールで元ファイルのエンコードを確認した上で再試行してください。
UTF-8 と検出されたファイルは文字コード変換は行われませんが、 DOCTYPE 宣言と charset メタタグの修正は実施されます。 すでに正しく記述されている場合はそのまま出力されます。
画像ファイルや PDF などのバイナリファイルは変換対象外です。 テキストベースのファイルのみに使用してください。