#author("2020-08-30T00:31:11+00:00","default:yusami","yusami") #author("2021-07-23T02:16:29+00:00","default:hotate","hotate") #contents &tag(文字コード,utf8); &tag(文字コード,utf8,日本語); * 情報 [#u36c047b] + [[円マーク(バックスラッシュ)のマッチ>http://chaichan.web.infoseek.co.jp/qa6500/qa6701.htm]] UTF-8では円記号(U+00A5)とバックスラッシュ(U+005C)はまったく異なる文字 PHPファイル自体がUTF-8で書かれているにしても、実際には何らかのエディタを使っていると思います。エディタの内部ではShift_JISなどのコードを使っている場合が多く、その場合はShift_JISからUTF-8に変換する、という作業をします。しかし、その変換テーブルは合意があるわけではなく、バラバラです。Shift_JISの0x5C(円記号)をUTF-8に変換する際には、円記号(U+00A5)に変換すべきか、バックスラッシュ(U+005C)に変換すべきかは意見が分かれるところです + [[Unicode ~ユニコードエスケープ形式とは~(文字コード関連) | 読み物 | ウナのIT資格一問一答>http://una.soragoto.net/topics/12.html]] この方法を使うと「\」と「u」、「0」~「9」、「A」~「F」の合計18種類の文字でUnicodeの全ての文字を表現できます。 -- [[Unicodeエスケープシーケンス変換|コードをホームページに載せる時に便利 | すぐに使える便利なWEBツール | Tech-Unlimited>https://tech-unlimited.com/escape-unicode.html]] テキストに含まれるマルチバイト文字を6桁のUnicodeエスケープシーケンスに変換します * 関連 [#d10a3d11] #taglist(tag=文字コード) ** [[utf-8]] [#e2f56ec5] #taglist(tag=utf8)