Software Overview / ソフトウェア概要

声の日記

Voice Diary & Memo System

音声をテキストに変換し、日記・忘備録・アイデアとして記録するブラウザアプリケーションです。マイクによるリアルタイム認識と、録音ファイルのAI文字起こしを組み合わせた、プライバシーを重視したローカル処理型の音声メモシステムです。

✓ マイク許可不要（ファイル取込） ✓ 外部サーバー送信なし ✓ データはPC内に保存 ✓ 完全無料・インストール不要

// System Specifications

TYPE シングルページ HTML アプリ

INSTALL 不要（ファイルを開くだけ）

NETWORK 初回モデルDLのみ

STORAGE ブラウザ localStorage

AI MODEL Whisper tiny (onnx-community)

MODEL SIZE 約 80MB（初回のみDL）

LANGUAGE 日本語・英語ほか

VOICE DIARY v7.0 · SINGLE FILE APP · NO BACKEND

// 01 — 主な機能

声を記録する、三つの方法

FEATURE 01

🎤

マイクリアルタイム認識

ブラウザ標準のWeb Speech APIを使い、話した言葉をリアルタイムで文字に変換します。確定テキストと未確定テキストを色分けして表示。

Chrome / Edge 専用

FEATURE 02

📁

AIファイル文字起こし

録音済みの音声ファイル（MP3・WAV・M4A等）をブラウザ内で読み込み、Whisper AIが自動で文字起こし。マイクの許可は一切不要です。

全ブラウザ対応・マイク不要

FEATURE 03

⌨️

キーボード直接入力

文字入力エリアに直接テキストを書き込めます。音声認識の結果を手動で修正・補足する際にも活用できます。

音声補完・手動修正に

FEATURE 04

📔

三種類のエントリー

「日記」「忘備録」「アイデア」の三つのカテゴリで記録を管理。タイトル・日付・本文・タグを付けて保存できます。

カテゴリ別カラー管理

FEATURE 05

🔍

検索・フィルタリング

保存したエントリーをキーワードで全文検索。カテゴリフィルターと組み合わせて、過去の記録をすばやく見つけられます。

リアルタイム絞り込み

FEATURE 06

↓

テキスト書き出し

すべての記録またはフィルター後の記録を、整形されたテキストファイル（.txt）としてダウンロードできます。

UTF-8 テキスト出力

// 02 — 使い方の流れ

ファイル取込の場合

一

ファイルを選択

ドラッグ&ドロップまたは
クリックして音声ファイルを選択
MP3 · WAV · M4A · OGG

二

モデルをロード

初回のみWhisper AIモデルを
自動ダウンロード（約80MB）
2回目以降はキャッシュ使用

三

AI文字起こし

ブラウザ内でWhisperが処理
音声データは外部に送られない
進捗がリアルタイムで表示

四

編集して保存

結果を確認・編集してから
日記・忘備録として保存
タグで分類管理

// 03 — 入力方式の詳細

三つの入力タブ

🎤 マイク録音タブ

マイクボタンをクリックするだけでリアルタイム認識が始まります。波形ビジュアライザーで録音状態を確認できます。

Web Speech API（Chrome内蔵）を使用
日本語（ja-JP）設定で高精度認識
話の途中で止まっても自動再開
録音時間をリアルタイム表示
マイク許可が必要（初回のみ）
対応：Chrome・Edge のみ

📁 ファイル取込タブ

録音済みの音声ファイルをAIが自動解析します。スマホで録音した音声を後でPCで文字起こしする使い方が最適です。

Whisper tiny モデルを使用（onnx-community）
MP3 · WAV · M4A · OGG · WebM · FLAC 対応
処理はすべてPC内のみ（外部送信なし）
マイク許可・インターネット送信不要
初回のみモデルDL（約80MB）が必要
全ブラウザ対応（Chrome推奨）

⌨️ キー入力タブ

テキストエリアに直接入力します。音声認識の誤りを修正したり、補足コメントを追加するのに便利です。

共通のテキストエリアを全タブで共有
音声認識の結果を直接編集可能
ペーストしてからそのまま保存も可
文字数をリアルタイムカウント
Ctrl+Enter で即保存
すべてのブラウザで動作

// 04 — プライバシーと安全性

データはすべてPC内で処理

// データの流れ

音声ファイル → ブラウザ内デコード
            → Whisper（ローカル処理）
            → テキスト結果表示
            → localStorage に保存

外部APIへの送信: なし
クラウドへのアップロード: なし
サーバーへのログ記録: なし

// 初回のみ必要なネットワーク通信

Whisper モデルファイル (cdn.jsdelivr.net)
Google Fonts (フォント読み込み)

✓

音声データは外部送信しない
ファイル取込時の音声はすべてブラウザ内のWhisperが処理します。音声データがインターネットに出ることはありません。
✓

日記データはPC内のみ保存
保存した日記・忘備録はブラウザの localStorage に記録されます。クラウドや外部サーバーへの同期は行いません。
✓

初回以降はオフライン動作可能
Whisperモデルがブラウザにキャッシュされた後は、インターネット接続なしで文字起こし機能が使用できます。
!

初回のみネットワーク接続が必要
WhisperモデルファイルとGoogle Fontsの読み込みに、初回起動時のインターネット接続が必要です。

// 05 — 記録の種類

三つのカテゴリで整理

📔

日記

日々の出来事や感情を時系列で記録。その日あったことや思ったことを音声で気軽に残せます。

使用例：
今日の出来事を話しながら記録
外出先での音声メモを後で日記に
一日の振り返りをまとめる

📝

忘備録

忘れたくない情報や手順、メモを保存。会議の内容、電話のメモ、買い物リストなどに。

使用例：
会議・打ち合わせの音声メモ
電話で聞いた連絡事項の記録
調べたことや調べるべきことのメモ

💡

アイデア

閃いたアイデアや企画をすばやく記録。思いついた瞬間に音声で残して、後でまとめられます。

使用例：
移動中のひらめきを即記録
企画・プロジェクトのアイデアメモ
創作・デザインのインスピレーション

// 06 — 技術仕様

使用技術と動作環境

UI / 構造HTML5 · CSS3 · Vanilla JavaScript
音声認識①Web Speech API（マイクタブ）
音声認識②Transformers.js + Whisper tiny（ファイルタブ）
AI モデルonnx-community/whisper-tiny（q4量子化）
音声デコードWeb Audio API (AudioContext 16kHz)
データ保存localStorage（ブラウザ内・暗号化なし）
フォントZen Old Mincho · Noto Serif JP · IBM Plex Mono
外部依存Google Fonts CDN · jsDelivr CDN（初回のみ）
バックエンドなし（完全クライアントサイド）
ファイル形式単一 .html ファイル（all-in-one）

// ブラウザ対応状況

Chrome

全機能対応

Edge

全機能対応

Firefox

ファイルのみ

Safari

ファイルのみ

// 対応音声フォーマット

MP3 WAV M4A OGG WebM FLAC AAC