#author("2020-08-30T00:31:11+00:00","default:yusami","yusami")
#author("2021-07-23T02:16:29+00:00","default:hotate","hotate")
#contents
&tag(文字コード,utf8);
&tag(文字コード,utf8,日本語);

* 情報 [#u36c047b]
+ [[円マーク(バックスラッシュ)のマッチ>http://chaichan.web.infoseek.co.jp/qa6500/qa6701.htm]]
 UTF-8では円記号(U+00A5)とバックスラッシュ(U+005C)はまったく異なる文字
 PHPファイル自体がUTF-8で書かれているにしても、実際には何らかのエディタを使っていると思います。エディタの内部ではShift_JISなどのコードを使っている場合が多く、その場合はShift_JISからUTF-8に変換する、という作業をします。しかし、その変換テーブルは合意があるわけではなく、バラバラです。Shift_JISの0x5C(円記号)をUTF-8に変換する際には、円記号(U+00A5)に変換すべきか、バックスラッシュ(U+005C)に変換すべきかは意見が分かれるところです
+ [[Unicode ~ユニコードエスケープ形式とは~(文字コード関連) | 読み物 | ウナのIT資格一問一答>http://una.soragoto.net/topics/12.html]]
 この方法を使うと「\」と「u」、「0」~「9」、「A」~「F」の合計18種類の文字でUnicodeの全ての文字を表現できます。
-- [[Unicodeエスケープシーケンス変換|コードをホームページに載せる時に便利 | すぐに使える便利なWEBツール | Tech-Unlimited>https://tech-unlimited.com/escape-unicode.html]]
 テキストに含まれるマルチバイト文字を6桁のUnicodeエスケープシーケンスに変換します

* 関連 [#d10a3d11]
#taglist(tag=文字コード)

** [[utf-8]] [#e2f56ec5]
#taglist(tag=utf8)

トップ   編集 差分 履歴 添付 複製 名前変更 リロード   新規 一覧 検索 最終更新   ヘルプ   最終更新のRSS