Forums: 公開討議 (Thread #30845)

v2.06以降では―をeucにしてutf8に戻すと化ける (2011-11-18 02:17 by sh #60621)

お世話になっております.自然言語処理でとても重宝させていただいております.



UTF8の上記文字をnkfでEUCにしてさらにUTF8に戻すと
* nkf2.05までだと化けませんが
* nkf2.07だと?に変わります.
これは仕様でしょうか?エンバグでしょうか.

自分としては2.05までの挙動のほうがありがたいです.
もしエンバグだとすれば,Fixされるとうれしいです.

Répondre à 60621×

You can not use Wiki syntax
Vous n'êtes pas connecté. Pour distinguer vos messages en provenance du reste, vous devez choisir un surnom. (L'unicité du surnom est pas réservé. Il est possible que quelqu'un d'autre pourrait utiliser exactement le même surnom. Si vous voulez l'assurance de votre identité, nous vous recommandons de vous connecter avant de poster.) Connexion

RE: v2.06以降では―をeucにしてutf8に戻すと化ける (2011-11-18 09:44 by naruse #60632)

2.0.5でUnicodeとの変換テーブルが整理された影響ですね。
標準ではJIS準拠の挙動を示すようになったので意図通りです。
具体的には U+2015 -> 0xA1BD -> U+2014 と変換されています。

以前のように0xA1BD->U+2014 と変換させたい場合は、
nkf -w --ic=cp51932 と指定してください。
Répondre à #60621

Répondre à 60632×

You can not use Wiki syntax
Vous n'êtes pas connecté. Pour distinguer vos messages en provenance du reste, vous devez choisir un surnom. (L'unicité du surnom est pas réservé. Il est possible que quelqu'un d'autre pourrait utiliser exactement le même surnom. Si vous voulez l'assurance de votre identité, nous vous recommandons de vous connecter avant de poster.) Connexion

RE: v2.06以降では―をeucにしてutf8に戻すと化ける (2011-11-18 22:44 by sh #60641)

成瀬様,さっそくのご連絡ありがとうございます.
教えていただいたオプションでうまく行きました.
とても助かりました.ありがとうございます.
Répondre à #60621

Répondre à 60641×

You can not use Wiki syntax
Vous n'êtes pas connecté. Pour distinguer vos messages en provenance du reste, vous devez choisir un surnom. (L'unicité du surnom est pas réservé. Il est possible que quelqu'un d'autre pourrait utiliser exactement le même surnom. Si vous voulez l'assurance de votre identité, nous vous recommandons de vous connecter avant de poster.) Connexion