UCS-2単位(Ver9.35対応版)
目次−
文字の単位−
UCS-2単位
秀丸単位(座標)
秀丸単位(文字列/行)
UCS-2単位
UCS-4単位
秀丸単位(カーソル移動)
書記素クラスター単位
UCS-2単位
UnicodeのUCS-2(1文字16bit=2バイト)として数えます。
V8.00以降からはwcslen等の文字列操作がありますが、V8.96以降では文字列操作以外のカーソル移動など、「秀丸単位(文字列/行)」にあるものの多くを、数え方だけを変えて使うことができます。
半角も全角も1文字として数えます。
U+10000以上の文字(UTF-16でサロゲートペアとなる文字)は2文字として数えます。
結合文字は別々に数えます。
エディタ本文では改行までを1行として数えます。
例:
半角 | 全角 | タブ | 結合文字 | サロゲートペア | 結合するカラー絵文字 |
1 | 1 | 1 | 1 + 1 | 2 | 2 + 1 + 2 |
A | あ | >(tab) |
か + ゙ | 𠀀 | 👨 + + 🦰 |
U+0041 | U+3042 | U+0009 | U+304b U+3099 | U+20000 | U+1F468 U+200D U+1F9B0 |
文字列用サンプル:"か\u3099\U00020000\U0001F468\u200D\U0001F9B0"
HTML用サンプル:が𠀀👨‍🦰
行内でカーソル右移動する例:
moveto_wcs column_wcs + 1, lineno;
行内でカーソル左移動する例:
moveto_wcs column_wcs - 1, lineno;