解説：Shift_JIS → UTF-8 変換ツール

SECTION 01

概要

本ツールは、Shift_JIS（または EUC-JP）で書かれた日本語の HTML・テキストファイルを、自動的に UTF-8 へ変換するブラウザ上で動作するWebアプリケーションです。

古いHTMLファイルには Shift_JIS エンコードのものが多く存在します。これらをモダンな環境で正しく扱うには UTF-8 への変換が必要ですが、本ツールを使えばドラッグ＆ドロップで複数ファイルを一括変換することができます。変換処理はすべてブラウザ内で完結するため、ファイルがサーバーに送信されることはありません。

SECTION 02

主な機能

🔍

文字コードの自動検出

encoding-japanese ライブラリを使い、Shift_JIS / EUC-JP / UTF-8 などを自動判定して一覧に表示します。

⚡

複数ファイルの一括変換

上限なく複数ファイルを同時にドロップ可能。1クリックですべてを順次変換・ダウンロードします。

📝

DOCTYPE 宣言の自動修正

古い HTML 4.01 形式の DOCTYPE を、現代標準の <!DOCTYPE html> に自動書き換えます。

🏷️

charset メタタグの更新

旧形式の Content-Type meta タグを <meta charset="UTF-8"> に変換します。

🔒

完全ローカル処理

すべての処理はブラウザ内のみで完結。ファイルは外部に一切送信されません。

📊

変換進捗の可視化

プログレスバーと統計カードで変換状況をリアルタイム表示。エラーも即座に確認できます。

SECTION 03

使い方

ファイルを読み込む

変換したいHTMLやテキストファイルを、ドロップゾーンへドラッグ＆ドロップします。または「📁 ファイルを選択」ボタンをクリックしてファイル選択ダイアログを開きます。複数ファイルを一度に選択・ドロップすることが可能です。

文字コードを確認する

読み込んだファイルの一覧が表示され、各ファイルの文字コードが自動検出されます。 Shift_JIS と表示されたファイルが変換対象です。 UTF-8 のファイルはそのまま出力されます。

変換してダウンロード

「⚡ すべて UTF-8 に変換してダウンロード」ボタンをクリックします。ファイルは1つずつ処理され、変換完了したものから自動的にダウンロードされます。出力ファイル名は 元のファイル名_utf8.html となります。

結果を確認する

すべての処理が完了すると統計カードに件数が表示されます。エラーが発生したファイルは赤色で表示されます。「クリア」ボタンで一覧をリセットし、次のファイルセットを処理できます。

SECTION 04

変換内容の詳細

変換時にファイルの内容に対して以下の書き換えが自動的に行われます。

#	変換前（旧形式）	変換後（新形式）	説明
①	<!DOCTYPE HTML PUBLIC "-//W3C//...">	<!DOCTYPE html>	HTML 4.01 / XHTML の DOCTYPE 宣言を HTML5 形式に統一
②	<meta http-equiv="Content-Type" content="text/html; charset=Shift_JIS">	<meta charset="UTF-8">	旧形式の Content-Type メタタグを HTML5 の簡略形式に変換
③	charset=Shift_JIS	charset="UTF-8"	残存する charset 属性値を UTF-8 に書き換え
④	（charset 宣言なし）	<meta charset="UTF-8"> を <head> 直後に挿入	charset 宣言がない HTML ファイルへの自動補完
⑤	EUC-JP エンコードのファイル	UTF-8 に変換 + メタタグ修正	EUC-JP 形式も Shift_JIS 同様に変換対象

変換例：HTML ファイルの場合

            
          
変換前 (Shift_JIS)
<!-- 旧形式の DOCTYPE と charset -->
<!DOCTYPE HTML PUBLIC "-//W3C//DTD HTML 4.01 Transitional//EN"
    "http://www.w3.org/TR/html4/loose.dtd">
<html lang="ja">
<head>
<meta http-equiv="Content-Type"
      content="text/html; charset=Shift_JIS">
<title>区民レポーター</title>
</head>

↓

            
          
変換後 (UTF-8)
<!-- HTML5 DOCTYPE + UTF-8 charset -->
<!DOCTYPE html>
<html lang="ja">
<head>
<meta charset="UTF-8">
<title>区民レポーター</title>
</head>

SECTION 05

動作仕様

動作環境	モダンブラウザ（Chrome / Firefox / Edge / Safari）
サーバー要件	不要（HTMLファイルをブラウザで開くだけで動作）
対応入力形式	.html, .htm, .txt, .css, .js, .xml, .csv, .json
対応入力エンコード	Shift_JIS, EUC-JP, UTF-8 およびその他の encoding-japanese 検出可能形式
出力エンコード	UTF-8（BOMなし）
同時処理ファイル数	上限なし（ブラウザのメモリに依存）
出力ファイル名	`元ファイル名_utf8.拡張子`
使用ライブラリ	encoding-japanese v2.1.0（CDN）
外部通信	Google Fonts（フォント読み込みのみ）、ファイルデータの外部送信なし

SECTION 06

注意事項

⚠ バックアップを取ってから使用してください
変換後のファイルは元のファイルを上書きしません（別名で保存）が、変換内容は自動処理のため、重要なファイルは事前に必ずオリジナルを保管してください。

📌 文字化けが発生した場合
文字コードの自動検出が誤った場合、文字化けが発生することがあります。この場合は別のブラウザやツールで元ファイルのエンコードを確認した上で再試行してください。

📌 UTF-8 ファイルの扱い
UTF-8 と検出されたファイルは文字コード変換は行われませんが、 DOCTYPE 宣言と charset メタタグの修正は実施されます。すでに正しく記述されている場合はそのまま出力されます。

📌 バイナリファイルについて
画像ファイルや PDF などのバイナリファイルは変換対象外です。テキストベースのファイルのみに使用してください。