パーセントエンコーディング

パンドラの箱を開けたのが祟って、まだ苦しんでいます。

日本人にとってはutf8ベースがデフォルトでよかったのですが、0x80〜0xFFを１バイト文字としてお使いだった皆さんにとっては、互換性がなくなってしまうんですよね。仏・独語あたりか？
#unescapePercentsのsendersを見ると、SARのメンバ名とかもデコードしているみたいなんですが、0x80〜0xFFを使ってしまっていたSARというのはないのか？
ある文字がパーセントエンコード対象かどうかは、RFC3986あたりに明確に定義されているのですが、過去のコードは、エンコード処理の判断・デコード処理の際のエスケープ判断など細かいばらつきがあるようです。（もう見るのが嫌になったので、これについては追求しないつもりですが。。。）

こんなところでの業務連絡で恐縮ですが、Stringの中でWideString newしちゃてました。うーんString refactoringちゃんと理解できていませんでした、すみません。