JavaTM Platform
Standard Ed. 6

java.net
类 IDN

java.lang.Object
  继承者 java.net.IDN

public final class IDN
     
extends Object

提供在普通 Unicode 表示形式和 ASCII 兼容性编码 (ACE) 表示形式之间进行国际化域名 (IDN) 转换的方法。国际化域名可以使用整个 Unicode 范围内的字符,而传统域名只限于 ASCII 字符。ACE 是只使用 ASCII 字符的 Unicode 字符串编码方式,能够与只识别传统域名的软件(如 Domain Name System)一起使用。

国际化域名在 RFC 3490 中定义。RFC 3490 定义了两种操作:ToASCII 和 ToUnicode。这两种操作使用 Nameprep 算法(Stringprep 的配置文件)和 Punycode 算法来回地转换域名字符串。

上述转换处理的行为可以用各种标志进行调整:

这些标志在逻辑上可以“或”运算为一个整体。

有关国际化域名支持的安全考虑至关重要。例如,英文域名可能被拼写成同形异义词,即故意用非 Latin 字母替代而错拼的词。Unicode Technical Report #36 讨论了 IDN 支持的安全问题以及可能的解决方案。在使用国际域名时应用程序负责采取足够的安全措施。

从以下版本开始:
1.6

字段摘要
static int ALLOW_UNASSIGNED
          允许处理未分配代码点的标志。
static int USE_STD3_ASCII_RULES
          根据 STD-3 ASCII 规则执行检查的标志。
 
方法摘要
static String toASCII(String input)
          根据 RFC 3490 的 ToASCII 操作中的定义,将字符串从 Unicode 转换为 ASCII 兼容性编码 (ACE)。
static String toASCII(String input, int flag)
          根据 RFC 3490 的 ToASCII 操作中的定义,将字符串从 Unicode 转换为 ASCII 兼容性编码 (ACE)。
static String toUnicode(String input)
          根据 RFC 3490 的 ToUnicode 操作中的定义,将字符串从 ASCII 兼容性编码 ACE) 转换为 Unicode。
static String toUnicode(String input, int flag)
          根据 RFC 3490 的 ToUnicode 操作中的定义,将字符串从 ASCII 兼容性编码 (ACE) 转换为 Unicode。
 
从类 java.lang.Object 继承的方法
clone, equals, finalize, getClass, hashCode, notify, notifyAll, toString, wait, wait, wait
 

字段详细信息

ALLOW_UNASSIGNED

public static final int ALLOW_UNASSIGNED
允许处理未分配代码点的标志。

另请参见:
常量字段值

USE_STD3_ASCII_RULES

public static final int USE_STD3_ASCII_RULES
根据 STD-3 ASCII 规则执行检查的标志。

另请参见:
常量字段值
方法详细信息

toASCII

public static String toASCII(String input,
                             int flag)
根据 RFC 3490 的 ToASCII 操作中的定义,将字符串从 Unicode 转换为 ASCII 兼容性编码 (ACE)。

ToASCII 操作可能失败。如果其任何步骤失败,则 ToASCII 失败。如果 ToASCII 操作失败,则抛出 IllegalArgumentException。在这种情况下,输入字符串不应在国际化域名中使用。

标签是域名的单独部分。根据 RFC 3490 中的定义,初始 ToASCII 操作只在单个标签上运行。通过假定域名中的标签始终用点分隔,此方法可以处理标签和整个域名。以下字符被识别为点:\u002E(句点)、\u3002(表意句点)、\uFF0E(全角句点)和 \uFF61(半角表意句点)。如果点被用作标签分隔符,则此方法在输出转换字符串中将它们全部更改为 \u002E(句点)。

参数:
input - 要处理的字符串
flag - 处理标志;可以为 0 或任何可能标志的逻辑或
返回:
已转换的 String
抛出:
IllegalArgumentException - 如果输入字符串未遵守 RFC 3490 规范

toASCII

public static String toASCII(String input)
根据 RFC 3490 的 ToASCII 操作中的定义,将字符串从 Unicode 转换为 ASCII 兼容性编码 (ACE)。

此便捷方法的工作方式类似于调用带两个参数的对应方法,如下所示:

toASCII(input, 0);

参数:
input - 要处理的字符串
返回:
已转换的 String
抛出:
IllegalArgumentException - 如果输入字符串未遵守 RFC 3490 规范

toUnicode

public static String toUnicode(String input,
                               int flag)
根据 RFC 3490 的 ToUnicode 操作中的定义,将字符串从 ASCII 兼容性编码 (ACE) 转换为 Unicode。

ToUnicode 永远不会失败。出现任何错误时,返回的输入字符串保持不变。

标签是域名的单独部分。根据 RFC 3490 中的定义,初始 ToUnicode 操作只在单个标签上运行。通过假定域名中的标签始终用点分隔,此方法可以处理标签和整个域名。以下字符被识别为点:\u002E(句点)、\u3002(表意句点)、\uFF0E(全角句点)和 \uFF61(半角表意句点)。

参数:
input - 要处理的字符串
flag - 处理标志;可以为 0 或任何可能标志的逻辑或
返回:
已转换的 String

toUnicode

public static String toUnicode(String input)
根据 RFC 3490 的 ToUnicode 操作中的定义,将字符串从 ASCII 兼容性编码 ACE) 转换为 Unicode。

此便捷方法的工作方式类似于调用带两个参数的对应方法,如下所示:

toUnicode(input, 0);

参数:
input - 要处理的字符串
返回:
已转换的 String

JavaTM Platform
Standard Ed. 6

提交错误或意见
有关更多的 API 参考资料和开发人员文档,请参阅 Java SE 开发人员文档。该文档包含更详细的、面向开发人员的描述,以及总体概述、术语定义、使用技巧和工作代码示例。

版权所有 2007 Sun Microsystems, Inc. 保留所有权利。 请遵守许可证条款。另请参阅文档重新分发政策