エンコードの種類の指定(Ver8.91対応版)
目次ファイル系コマンド− エンコードの種類の指定
 [動作環境]-[ファイル]で、開くダイアログの種類が「Windows2000タイプ」「Windows95タイプ」「Windows3.1タイプ」のいずれか場合、「開く」もしくは「名前を付けて保存」でエンコードの種類を指定することができます。

 エンコードの種類とは、テキストファイルのファイル形式で、単に「文字コード」と言う場合もあります。
 「エンコード」の意味は、文字をコード化、つまり文字の情報をファイルに書き出すときに使う言葉です。 その逆でファイルを読み込んで文字にするときは「デコード」と言いますが、昨今では「エンコード」という言葉が一般化しているため、 エンコード」という用語だけを使うようにしています。かといって、読み込み時に「エンコード」というのは間違いなので、秀丸エディタでは「エンコードの種類」と表現しています。

 エンコードの種類は、ダイアログ中の「エンコードの種類」で指定します。
 選べる種類は、以下のものがあります

SHIFT-JIS
EUC
JIS
Unicode(UTF-16)
Unicode(UTF-16,Big-Endian)
Unicode(UTF-8)
Unicode(UTF-7)
欧文
簡体字中国語(GB2312)
繁体字中国語(Big-5)
韓国語
韓国語(Johab)
中央ヨーロッパ言語
バルト語
ギリシャ語
キリル言語
シンボル
トルコ語
ヘブライ語
アラビア語
タイ語
ベトナム語
Macintosh
OEM/DOS
その他


 一度エンコードの種類を指定してオープンすると、上書き保存するときも同じエンコードの種類で保存されます。

 「名前を付けて保存」ダイアログの「BOMを付ける」は、Unicode(UTF-16),Unicode(UTF-16,Big-Endian),Unicode(UTF-8)のときのみ選ぶことができます。
 BOMとは、「Byte Order Mark」の略で、UnicodeのファイルのときにUnicodeのファイルであることとUnicodeのバイト順を示すためのマークです。
 「BOMを付ける」にチェックを入れると、ファイル先頭にBOMを書き込みます。
 一般的に、Unicode(UTF-16),Unicode(UTF-16,Big-Endian)のファイルにはBOMを書きます。
 Unicode(UTF-8)の場合は、本来あるべきではないとも言われていますが、Windows標準のメモ帳では付いたりするし、処理するソフトによって対応もまちまちなので状況によって使い分ける必要があります。秀丸エディタは有り無しどちらにも対応できます。

 Unicode(UTF-16)は、他のソフトでは「UTF-16LE」「UTF-16 Little Endian」または単に「Unicode」と表現されることがあります。
 Unicode(UTF-16,Big-Endian)は、他のソフトでは「UTF-16BE」「Unicode big endian」と表現されることがあります。
 Unicode(UTF-8)は、俗にBOMなしの場合をUTF-8Nと呼ぶことがあるようですが、秀丸エディタの表現はBOMありでもなしでもUTF-8です。

 [動作環境]-[ファイル]-[エンコーディング2]で、特定のドライブをEUCコードのファイルとして読み込むことも可能です。