みなさん、テキストファイルって使っていますか?たぶん、業務ではあまり使われていないかもしれませんね。今回は少し概要的なお話しをします。
そもそもテキストファイルというのは、どんなものかというと、文字情報だけで、フォントサイズや罫線などの装飾情報ないものを指します。ただし、記号を使って、装飾的なものを施すことはあります。
単純な文字だけのプレーンテキストをテキストファイルと呼ぶこともありますが、今回はもっと広い意味でのテキストファイルの話をしたいと思います。テキスト形式ファイルといったほうがいいかもしれません。つまり、一定の約束事を文字または記号に与えることで、そのテキスト形式ファイルを特定のソフトに読み込ませることでその約束事を装飾や動き、変えることもできるのです。
ピンとこない人も多いと思いますが、様々なサイトの表示のもとになっているHTMLファイルもテキスト形式ですし、それに色や文字サイズなどの情報を与えるCSSファイルもテキスト形式です。電子納品のインデックスで使われているXMLファイルもテキスト形式ですし、CSVと呼ばれるカンマ区切りファイルもテキスト形式です。この形式はエクセルはもちろん、会計ソフトなどの業務系ソフトでもサポートしていることが多いので知らずに使っている人もいるかもしれませんね。
ちょっと変わったところで、Windows Live メールの保存形式であるemlファイルも実はテキスト形式です。保存フォルダのファイルをテキストエディターで開くと文章がそのまま読めることがわかります。
このようにテキストファイルは様々な形でみなさんの周りで使われていることがわかったと思います。ちなみにこれの対になるのがバイナリ形式ファイルといいます。昔のエクセルやワードファイルや画像ファイルがこれにあたります。
ところでテキストファイルのメリットとは何でしょう。一番大きいのは、互換性・汎用性の高さです。エクセルやワードはもちろん、CADソフトでもテキスト入力エリアであれば、読み込むことが可能です。また、Windows、Mac、Linuxでも文字コードの変換が必要な場合がありますが、相互の読み込ませることが可能です。さらにワープロ時代に作ったファイルでもテキスト化できれば、文章を抽出することが可能です。
先ほど話したインターネット関連ファイルであるHTMLファイルやCSSファイル、メールのEMLファイルがテキストなのもこの互換性や汎用性の高さから来ているのだと思います。
さらに保存性が高いのも特徴です。バイナリ形式ファイルはソフトがなくなったり、古いバージョンと互換性がない新しいバージョンしかないと読めない可能性が高いですが、テキストファイルにはその問題がありません。どんなに古いパソコンで作成したテキストファイルでも読むことに何の支障もありません。
また、文字情報だけなのでファイルサイズが小さいです。新聞1枚分の情報量で32kBです。昔のワードファイルで文字情報だけを保存したとしても64kBとなり、倍のサイズが必要です。(ただし、最近のファイル形式だと圧縮率が高いので逆に12.5kBと小さくなるのでテキストファイルが絶対いいというのはサイズに関しては言えなくなりました)
これはあまり使っていない方にはピンとこないと思いますが、テキストファイルのうち拡張子が(.txt)で保存している場合はWindowsのファイル検索でファイルの中まで検索してくれます。ファイル名が何であれ、書いてあることで調べられるのは大変重宝します。
では、デメリットは何でしょう。
当たり前ですが、装飾ができません。文字サイズを一部変えることやフォントの種類を変えること、下線を引くことなどができません。行間や文字間の工夫で見やすくすることは多少できますが、色付けなど含めると見やすさは格段に落ちます。
あと、テキストファイルは文字コードの影響を受けます。様々な文字コードを読み込めるテキストエディターのようなソフトを持っていればいいですが、Windows標準のメモ帳だけだと文字コードがうまく認識できずに文字化けで読めない可能性があります。これに気づかずに別の文字コードで上書き保存して本当に読めなくしてしまう悲劇も少なくありません。
今回はメリット、デメリットを中心にテキストファイルの特徴をお話ししましたが、意外と多くの場所に使われていることを知っていただければ幸いです。