トークン数推定ツール
テキストを入力すると概算トークン数とAPI料金を表示します。日本語・英語の混在テキストにも対応。
テキストを入力
サンプル:
推定結果
推定トークン数
0
文字数
0
単語数
0
日本語比率
0%
モデル:
入力として使った場合の料金
$0.000000
出力として生成した場合の料金
$0.000000
全モデル料金比較
| モデル | 入力料金 | 出力料金 |
|---|---|---|
| Claude Opus 4 | $0.000000 | $0.000000 |
| Claude Sonnet 4 | $0.000000 | $0.000000 |
| Claude Haiku 3.5 | $0.000000 | $0.000000 |
トークンとは?
トークンはAIモデルがテキストを処理する最小単位です。単語そのものではなく、単語の一部や記号が1トークンになります。
英語の場合
約4文字 = 1トークン。英単語1語は平均0.75トークン程度。
例: "Hello world" = 約2トークン
日本語の場合
約1〜2文字 = 1トークン。英語と比べてトークン効率が低い(同じ意味でもトークン数が多くなる)。
例: 「こんにちは」 = 約3〜4トークン
※ 注意: 本ツールのトークン数は文字種ベースの概算値です。実際のトークン数はモデルのトークナイザ(BPE)により異なります。 正確なトークン数の確認にはAPIレスポンスのusageフィールドを参照してください。
このツールについて
トークンとは何か
Claudeなど大規模言語モデルはテキストをそのまま扱うのではなく、「トークン」という単位に分解して処理します。トークンは単語より小さい単位で、概ね以下のような換算です。
- 英語: 1トークン ≒ 0.75単語(1単語 ≒ 1.3トークン)
- 日本語: 1文字 ≒ 2〜3トークン(ひらがな・漢字・記号で変動)
- コード: 予約語や記号は1トークンずつ消費する傾向
なぜ日本語はトークン効率が悪いのか
ClaudeのトークナイザーはBPE(Byte Pair Encoding)ベースで、主に英語テキストで学習されています。英語の頻出単語は1トークンで表現できますが、日本語はUnicodeのバイト列として符号化され、1文字が複数トークンに分解されることが多くなります。
このため、同じ内容を伝えるのに日本語は英語の2〜3倍のトークンを消費し、API料金も2〜3倍かかる計算になります。
使い方とヒント
- ざっくり見積もり用: 本ツールの結果はおおよその目安です。正確な値は実APIのusageフィールドを参照してください。
- コスト最適化: 英語で通じる内容(コードレビュー、技術文書など)は英語プロンプトを使うと2〜3倍のコスト削減が可能。
- 長文入力の注意: コンテキストウィンドウ(Claude 4系で200k tokens)を意識。超過するとエラーになります。
- Prompt Cachingの基準: キャッシュは1,024トークン以上のブロックのみ対象。短いシステムプロンプトはキャッシュされません。