English help on website



エンコードの種類の指定(Ver9.34対応版)
目次コマンドファイル系コマンド− エンコードの種類の指定
[ファイル]→[開く]や[ファイル]→[名前を付けて保存...]などで、エンコードの種類を指定して開いたり保存することができます。
または、ファイルを開いた後に、[ファイル]→[エンコードの種類]のサブメニューよりエンコードの種類を変更できます。

エンコードの種類とは、テキストファイルのファイル形式で、単に「文字コード」と言う場合もあります。
「エンコード」の意味は、文字をコード化、つまり文字の情報をファイルに書き出すときに使う言葉です。その逆でファイルを読み込んで文字にするときは「デコード」と言いますが、昨今では「エンコード」という言葉が一般化しているため、エンコードという用語だけを使うようにしています。かといって、読み込み時に「エンコード」というのは間違いなので、秀丸エディタでは「エンコードの種類」と表現しています。

選べる種類は、以下のものがあります

日本語(Shift-JIS)
日本語(EUC)
日本語(JIS)
Unicode(UTF-16)
Unicode(UTF-16,Big-Endian)
Unicode(UTF-8)
Unicode(UTF-7)
欧文
簡体字中国語(GB2312)
繁体字中国語(Big-5)
韓国語
韓国語(Johab)
中央ヨーロッパ言語
バルト語
ギリシャ語
キリル言語
シンボル
トルコ語
ヘブライ語
アラビア語
タイ語
ベトナム語
Macintosh
OEM/DOS
その他
Unicode(UTF-32)
Unicode(UTF-32,Big-Endian)
Unicode(UTF-16)は、他のアプリでは「UTF-16LE」「UTF-16 Little Endian」または単に「Unicode」と表現されることがあります。
Unicode(UTF-16,Big-Endian)は、他のアプリでは「UTF-16BE」「Unicode big endian」と表現されることがあります。
Unicode(UTF-8)は、俗にBOMなしの場合をUTF-8Nと呼ぶことがあるようですが、秀丸エディタの表現はBOMありでもなしでもUTF-8です。

エンコードの種類を指定してファイルを開くと、上書き保存するときも同じエンコードの種類で保存されます。

BOM
BOMとは、「Byte Order Mark」の略で、Unicodeのファイルのときのファイル形式を示すための情報です。ファイル先頭の2〜4バイトにあります。
名前を付けて保存ダイアログの「BOMを付ける」は、Unicode(UTF-16),Unicode(UTF-16,Big-Endian),Unicode(UTF-8),Unicode(UTF-32),Unicode(UTF-32,Big-Endian),のときのみ選ぶことができます。
「BOMを付ける」にチェックを入れると、ファイル先頭にBOMを書き込みます。
一般的に、Unicode(UTF-16),Unicode(UTF-16,Big-Endian)のファイルにはBOMを書きます。
Unicode(UTF-8)の場合は、本来あるべきではないとも言われていますが、Windows標準のメモ帳では付いたりするし、処理するアプリによって対応もまちまちなので状況によって使い分ける必要があります。秀丸エディタは有り無しどちらにも対応できます。

エンコードの種類の変更
ファイルを開いた後に、[ファイル]→[エンコードの種類]のサブメニューより、エンコードの種類を変更できます。
このとき、[ファイルを読み込みし直す]/[内容を維持したまま適用]を選ぶことができます。

新規作成状態からも、[ファイル]→[エンコードの種類]のサブメニューより、エンコードの種類を変更できます。
このとき、[強制的に開く]/[内容を維持したまま適用]を選ぶことができます。
[強制的に開く]は、そのとき秀丸エディタが保持している情報を変換せずに適用するので、文字によっては文字コードの変換になりますが、秀丸エディタ独自の混在した情報の場合もあるため、必ずしも変換されるわけではありません。
文字コードの変換で使うには、既存のファイルを開いてから、[ファイル]→[エンコードの種類]のサブメニューを選んでください。

関連する設定
[動作環境]-[ファイル]-[エンコーディング1]/[動作環境]-[ファイル]-[エンコーディング2]に設定があります。
[ファイルタイプ別の設定]-[その他]-[保存・読み込み]にも設定があります。