从 URL 中提取域名
从 URL 中提取域名的任务经常出现。本文讨论了此任务的常见 Java 实现,并探索了提高准确性和处理潜在边缘情况的替代方法。
初始实现
提供的 Java 代码从规范化开始如果需要,可以在 URL 前面加上“http://”。然后,它使用 java.net.URL 解析 URL 以获取主机字符串。最后,如果主机以“www”开头,则为“www”之后的子字符串。作为域名返回。
替代方法
但是,这种方法有局限性:
- 它无法处理某些边缘情况,例如路径以“http”或“www”开头的相对 URL。
- 它假设协议始终为小写,这不是一个有效的假设。
- 它在执行期间执行不必要的 DNS 查找。 URL 相等性检查,这可能导致拒绝服务攻击。
改进的实现
要解决这些问题,我们建议使用 java.net.URI网址解析。 URI 提供了更健壮和可靠的方法:
<code class="java">public static String getDomainName(String url) throws URISyntaxException { URI uri = new URI(url); String domain = uri.getHost(); return domain.startsWith("www.") ? domain.substring(4) : domain; }</code>
此代码将 URL 转换为 URI,获取主机字符串,并删除“www”。前缀(如果存在)。
其他注意事项
即使改进了实现,仍然可能存在一些需要注意的边缘情况。 RFC 3986 附录 B 提供了一个正则表达式,可以处理更复杂的 URI 解析场景。
边缘情况
以下是初始实现可能失败的一些额外边缘情况处理:
- 路径或主机中带有多个斜杠的 URL
- 带有编码字符的 URL
- 带有查询字符串或片段标识符的 URL
- 解析为非 ASCII 域名的 URL
总体而言,使用 java.net.URI 进行 URL 解析提供了一种更全面、更准确的方法来从 URL 中提取域名,特别是在处理复杂或潜在的情况时无效网址。
以上是如何用Java准确地从URL中提取域名?的详细内容。更多信息请关注PHP中文网其他相关文章!

本文分析了2025年的前四个JavaScript框架(React,Angular,Vue,Susve),比较了它们的性能,可伸缩性和未来前景。 尽管由于强大的社区和生态系统,所有这些都保持占主导地位,但它们的相对人口

本文介绍了SnakeyAml中的CVE-2022-1471漏洞,这是一个允许远程代码执行的关键缺陷。 它详细介绍了如何升级春季启动应用程序到Snakeyaml 1.33或更高版本的降低风险,强调了依赖性更新

Java的类上载涉及使用带有引导,扩展程序和应用程序类负载器的分层系统加载,链接和初始化类。父代授权模型确保首先加载核心类别,从而影响自定义类LOA

本文讨论了使用咖啡因和Guava缓存在Java中实施多层缓存以提高应用程序性能。它涵盖设置,集成和绩效优势,以及配置和驱逐政策管理最佳PRA

Node.js 20通过V8发动机改进可显着提高性能,特别是更快的垃圾收集和I/O。 新功能包括更好的WebSembly支持和精制的调试工具,提高开发人员的生产率和应用速度。

本文使用lambda表达式,流API,方法参考和可选探索将功能编程集成到Java中。 它突出显示了通过简洁性和不变性改善代码可读性和可维护性等好处

本文探讨了在黄瓜步骤之间共享数据的方法,比较方案上下文,全局变量,参数传递和数据结构。 它强调可维护性的最佳实践,包括简洁的上下文使用,描述性


热AI工具

Undresser.AI Undress
人工智能驱动的应用程序,用于创建逼真的裸体照片

AI Clothes Remover
用于从照片中去除衣服的在线人工智能工具。

Undress AI Tool
免费脱衣服图片

Clothoff.io
AI脱衣机

AI Hentai Generator
免费生成ai无尽的。

热门文章

热工具

记事本++7.3.1
好用且免费的代码编辑器

适用于 Eclipse 的 SAP NetWeaver 服务器适配器
将Eclipse与SAP NetWeaver应用服务器集成。

EditPlus 中文破解版
体积小,语法高亮,不支持代码提示功能

PhpStorm Mac 版本
最新(2018.2.1 )专业的PHP集成开发工具

SublimeText3汉化版
中文版,非常好用