パーセントエンコーディング

パンドラの箱を開けたのが祟って、まだ苦しんでいます。

  • 日本人にとってはutf8ベースがデフォルトでよかったのですが、0x80〜0xFFを1バイト文字としてお使いだった皆さんにとっては、互換性がなくなってしまうんですよね。仏・独語あたりか?
  • #unescapePercentsのsendersを見ると、SARのメンバ名とかもデコードしているみたいなんですが、0x80〜0xFFを使ってしまっていたSARというのはないのか?
  • ある文字がパーセントエンコード対象かどうかは、RFC3986あたりに明確に定義されているのですが、過去のコードは、エンコード処理の判断・デコード処理の際のエスケープ判断など細かいばらつきがあるようです。(もう見るのが嫌になったので、これについては追求しないつもりですが。。。)

こんなところでの業務連絡で恐縮ですが、Stringの中でWideString newしちゃてました。うーんString refactoringちゃんと理解できていませんでした、すみません。