Word では 1,200 と表示されているのに、CMS やオンラインの文字数カウンターでは 1,145 になる。このような差はよくあります。多くの場合、どちらかが壊れているのではなく、数えている対象が違います。Word、CMS、SEO 入力欄、SNS 投稿ツールが同じ運用フローに入ると、この差は自然に発生します。
1. まず確認すべきは「何を数えているか」
プラットフォームごとに集計対象は同じではありません。文字数、単語数、空白込みの文字数、記号除外、HTML 除去後の可視テキストなど、定義が違います。
- Word は単語数、文字数(空白あり / なし)、段落数、ページ数などを表示できます。
- Web ツールは整形情報を取り除いた可視テキストを数えることが多いです。
- SEO や広告プラットフォームは独自の表示長・制限ルールを持つことがあります。
つまり、指標名を揃えずに比較すると、両方正しくても数字だけが食い違って見えます。
2. Word とサイトの文字数がズレる主な理由
空白と改行の扱いが違う
Word は空白込み・空白なしの両方を扱えますが、多くの Web ツールは連続空白、Tab、改行をまとめてから数えます。
日本語・英語・中国語混在で境界が変わる
英語は単語単位、日本語や中国語は文字単位で見られることが多く、URL、数字、記号が混ざると境界判定が大きく変わります。
記号を含めるかどうか
句読点、かっこ、長音記号、全角記号を文字数に含めるかどうかはツールによって異なります。
隠し要素やレビュー情報
Word にはヘッダー、フッター、脚注、コメント、変更履歴、テキストボックス、隠し文字が含まれることがあります。CMS に貼り付けると、それらの多くは反映されません。
HTML と書式の正規化
Web 側では HTML タグ、インラインスタイル、ゼロ幅文字、Word 固有の書式情報を除去してから保存することがあります。見た目が同じでも、実際に数えている文字列は変わっています。
3. 差が出やすい場面
| 場面 | Word 側で差が出る理由 | Web 側の一般的な処理 |
|---|---|---|
| Word から CMS へ貼り付ける | 段落記号、注釈、隠し書式が元文書に残る | 貼り付け時に書式や余計なマークアップを除去する |
| 多言語混在の原稿 | 単語数と文字数のルールが混在する | 単語のみ、または可視文字のみを数える場合がある |
| URL や表を含む内容 | URL、列区切り、改行位置が影響する | URL を 1 トークンとして扱い、表を平文化する |
| SEO や SNS 用テキスト | Word は表示制限を考慮しない | 各プラットフォーム独自の長さ制限が適用される |
4. どの数字が正しいのか
正しい数字は、用途で決まります。
- 編集者や学校、顧客への提出なら Word の集計が基準になることがあります。
- CMS や Web サイトへの掲載なら、実際に保存・表示される Web 側の内容が基準です。
- SEO タイトルや広告文では、そのプラットフォームの制限値だけが重要です。
避けるべきなのは差そのものではなく、判断に対して間違った基準を使うことです。
5. 実務で差を減らす方法
- まず最終公開に近いプレーンテキストに整えてから比較する。
- そのツールが単語数、文字数、空白込み文字数のどれを出しているか確認する。
- Word から貼る前に、変更履歴、コメント、テキストボックス、余分な書式を削除する。
- 共有時は「約 1,200 文字」「約 800 words」のように単位を明記する。
- どのプラットフォームの数値を最終値にするか、チームでルール化する。
まとめ
Word と Web サイトで文字数が違っても、どちらかが間違っているとは限りません。Word は文書作成と版面情報向け、Web ツールは公開される可視テキスト向けです。先に目的を決めれば、このズレは十分に説明でき、運用もしやすくなります。