c01-data-quality-v2

表記変換と文字セット マッピング

住所を検証しやすいように外国語を変換

概要

ギリシャ語、ロシア語、中国語など、母国語以外の言語が出てくる作業に苦労していませんか。

インフォマティカの住所検証文字セット マッピングと表記変換機能は、一般的なほぼ全ての文字セットに対応し、それらの文字列を扱う際にとても役に立ちます。この機能は 40 種類の文字セットをサポートしており、Transliteration では 5 種類の非ラテン文字をラテン文字に変換できます。

  • UTF-8、ISO 8859-1、GBK、BIG5、JIS, EBCDIC を含む 40 種類の文字セットをマッピング
  • 'a' ~ 'Z' と '0' ~ '9' で文字をフィルタリング
  • 言語固有の規則に従って発音区別符号を正しく削除
  • HTML と URL のエンコーディングとデコーディングを実行
  • Unix と Windows の間で改行を変換

住所検証は、以下の非ラテン文字をサポートします。

  • ギリシャ文字表記 (BGN/PCGN 1962、ISO 843 - 1997)
  • キリル文字表記 (BGN/PCGN 1947、ISO 9 - 1995)
  • 日本語表記 (カタカナ、ひらがな、漢字)
  • 簡体字および繁体字中国語ピンイン表記 (北京語、広東語)
  • 韓国語ハングル表記

Address Verification Character Set Mapping と Transliteration は、Unicode に完全に対応しています。