Tag: 文字コード utf8

情報

  1. 円マーク(バックスラッシュ)のマッチ
    UTF-8では円記号(U+00A5)とバックスラッシュ(U+005C)はまったく異なる文字
    PHPファイル自体がUTF-8で書かれているにしても、実際には何らかのエディタを使っていると思います。エディタの内部ではShift_JISなどのコードを使っている場合が多く、その場合はShift_JISからUTF-8に変換する、という作業をします。しかし、その変換テーブルは合意があるわけではなく、バラバラです。Shift_JISの0x5C(円記号)をUTF-8に変換する際には、円記号(U+00A5)に変換すべきか、バックスラッシュ(U+005C)に変換すべきかは意見が分かれるところです
  2. Unicode ~ユニコードエスケープ形式とは~(文字コード関連) | 読み物 | ウナのIT資格一問一答
    この方法を使うと「\」と「u」、「0」~「9」、「A」~「F」の合計18種類の文字でUnicodeの全ての文字を表現できます。

関連

utf-8


トップ   新規 一覧 検索 最終更新   ヘルプ   最終更新のRSS