Word の文字数とサイト上の文字数はなぜ違うのか?

Word では 1,200 と表示されているのに、CMS やオンラインの文字数カウンターでは 1,145 になる。このような差はよくあります。多くの場合、どちらかが壊れているのではなく、数えている対象が違います。Word、CMS、SEO 入力欄、SNS 投稿ツールが同じ運用フローに入ると、この差は自然に発生します。

1. まず確認すべきは「何を数えているか」

プラットフォームごとに集計対象は同じではありません。文字数、単語数、空白込みの文字数、記号除外、HTML 除去後の可視テキストなど、定義が違います。

  • Word は単語数、文字数(空白あり / なし)、段落数、ページ数などを表示できます。
  • Web ツールは整形情報を取り除いた可視テキストを数えることが多いです。
  • SEO や広告プラットフォームは独自の表示長・制限ルールを持つことがあります。

つまり、指標名を揃えずに比較すると、両方正しくても数字だけが食い違って見えます。

2. Word とサイトの文字数がズレる主な理由

空白と改行の扱いが違う

Word は空白込み・空白なしの両方を扱えますが、多くの Web ツールは連続空白、Tab、改行をまとめてから数えます。

日本語・英語・中国語混在で境界が変わる

英語は単語単位、日本語や中国語は文字単位で見られることが多く、URL、数字、記号が混ざると境界判定が大きく変わります。

記号を含めるかどうか

句読点、かっこ、長音記号、全角記号を文字数に含めるかどうかはツールによって異なります。

隠し要素やレビュー情報

Word にはヘッダー、フッター、脚注、コメント、変更履歴、テキストボックス、隠し文字が含まれることがあります。CMS に貼り付けると、それらの多くは反映されません。

HTML と書式の正規化

Web 側では HTML タグ、インラインスタイル、ゼロ幅文字、Word 固有の書式情報を除去してから保存することがあります。見た目が同じでも、実際に数えている文字列は変わっています。

3. 差が出やすい場面

場面 Word 側で差が出る理由 Web 側の一般的な処理
Word から CMS へ貼り付ける 段落記号、注釈、隠し書式が元文書に残る 貼り付け時に書式や余計なマークアップを除去する
多言語混在の原稿 単語数と文字数のルールが混在する 単語のみ、または可視文字のみを数える場合がある
URL や表を含む内容 URL、列区切り、改行位置が影響する URL を 1 トークンとして扱い、表を平文化する
SEO や SNS 用テキスト Word は表示制限を考慮しない 各プラットフォーム独自の長さ制限が適用される

4. どの数字が正しいのか

正しい数字は、用途で決まります。

  • 編集者や学校、顧客への提出なら Word の集計が基準になることがあります。
  • CMS や Web サイトへの掲載なら、実際に保存・表示される Web 側の内容が基準です。
  • SEO タイトルや広告文では、そのプラットフォームの制限値だけが重要です。

避けるべきなのは差そのものではなく、判断に対して間違った基準を使うことです。

5. 実務で差を減らす方法

  1. まず最終公開に近いプレーンテキストに整えてから比較する。
  2. そのツールが単語数、文字数、空白込み文字数のどれを出しているか確認する。
  3. Word から貼る前に、変更履歴、コメント、テキストボックス、余分な書式を削除する。
  4. 共有時は「約 1,200 文字」「約 800 words」のように単位を明記する。
  5. どのプラットフォームの数値を最終値にするか、チームでルール化する。

まとめ

Word と Web サイトで文字数が違っても、どちらかが間違っているとは限りません。Word は文書作成と版面情報向け、Web ツールは公開される可視テキスト向けです。先に目的を決めれば、このズレは十分に説明でき、運用もしやすくなります。

実務ヒント
Word とサイトの数値を比較したいときは、まずプレーンテキストへ整形し、同じ原稿を両方のツールに入れて測定してください。