トークン数推定ツール

テキストを入力すると概算トークン数とAPI料金を表示します。日本語・英語の混在テキストにも対応。

テキストを入力
サンプル:

推定結果

推定トークン数

0

文字数

0

単語数

0

日本語比率

0%

モデル:

入力として使った場合の料金

$0.000000

出力として生成した場合の料金

$0.000000

全モデル料金比較

モデル入力料金出力料金
Claude Opus 4$0.000000$0.000000
Claude Sonnet 4$0.000000$0.000000
Claude Haiku 3.5$0.000000$0.000000

トークンとは?

トークンはAIモデルがテキストを処理する最小単位です。単語そのものではなく、単語の一部や記号が1トークンになります。

英語の場合

約4文字 = 1トークン。英単語1語は平均0.75トークン程度。
例: "Hello world" = 約2トークン

日本語の場合

約1〜2文字 = 1トークン。英語と比べてトークン効率が低い(同じ意味でもトークン数が多くなる)。
例: 「こんにちは」 = 約3〜4トークン

※ 注意: 本ツールのトークン数は文字種ベースの概算値です。実際のトークン数はモデルのトークナイザ(BPE)により異なります。 正確なトークン数の確認にはAPIレスポンスのusageフィールドを参照してください。

このツールについて

トークンとは何か

Claudeなど大規模言語モデルはテキストをそのまま扱うのではなく、「トークン」という単位に分解して処理します。トークンは単語より小さい単位で、概ね以下のような換算です。

  • 英語: 1トークン ≒ 0.75単語(1単語 ≒ 1.3トークン)
  • 日本語: 1文字 ≒ 2〜3トークン(ひらがな・漢字・記号で変動)
  • コード: 予約語や記号は1トークンずつ消費する傾向

なぜ日本語はトークン効率が悪いのか

ClaudeのトークナイザーはBPE(Byte Pair Encoding)ベースで、主に英語テキストで学習されています。英語の頻出単語は1トークンで表現できますが、日本語はUnicodeのバイト列として符号化され、1文字が複数トークンに分解されることが多くなります。

このため、同じ内容を伝えるのに日本語は英語の2〜3倍のトークンを消費し、API料金も2〜3倍かかる計算になります。

使い方とヒント

  • ざっくり見積もり用: 本ツールの結果はおおよその目安です。正確な値は実APIのusageフィールドを参照してください。
  • コスト最適化: 英語で通じる内容(コードレビュー、技術文書など)は英語プロンプトを使うと2〜3倍のコスト削減が可能。
  • 長文入力の注意: コンテキストウィンドウ(Claude 4系で200k tokens)を意識。超過するとエラーになります。
  • Prompt Cachingの基準: キャッシュは1,024トークン以上のブロックのみ対象。短いシステムプロンプトはキャッシュされません。