UCS-4単位(Ver9.35対応版)
目次−
文字の単位−
UCS-4単位
秀丸単位(座標)
秀丸単位(文字列/行)
UCS-2単位
UCS-4単位
秀丸単位(カーソル移動)
書記素クラスター単位
UCS-4単位
UnicodeのUCS-4(1文字32bit=4バイト)として数えます。
V8.96以降で「秀丸単位(文字列/行)」にあるものの多くを、数え方だけを変えて使うことができます。
半角も全角も1文字として数えます。
U+10000以上の文字(UTF-16でサロゲートペアとなる文字)は1文字として数えます。
結合文字は別々に数えます。
エディタ本文では改行までを1行として数えます。
例:
半角 | 全角 | タブ | 結合文字 | サロゲートペア | 結合するカラー絵文字 |
1 | 1 | 1 | 1 + 1 | 1 | 1 + 1 + 1 |
A | あ | >(tab) |
か + ゙ | 𠀀 | 👨 + + 🦰 |
U+0041 | U+3042 | U+0009 | U+304b U+3099 | U+20000 | U+1F468 U+200D U+1F9B0 |
文字列用サンプル:"か\u3099\U00020000\U0001F468\u200D\U0001F9B0"
HTML用サンプル:が𠀀👨‍🦰
行内でカーソル右移動する例:
moveto_ucs4 column_ucs4 + 1, lineno;
行内でカーソル左移動する例:
moveto_ucs4 column_ucs4 - 1, lineno;