纯C语言实现的HTML5解析库 Gumbo

Gumbo 是 Google 的一款用C语言实现的HTML5解析库,无需任何外部依赖。

特征:

  • 遵循 HTML5 规范
  • 功能强大,可处理一些不规范的 HTML 标签
  • 简单的 API
  • 支持源位置和指针回到原始文本
  • 轻巧、没有外部依赖
  • 通过 html5lib-0.95 兼容测试
  • 已在超过25亿个来自谷歌索引的页面中进行过测试

项目地址

https://github.com/google/gumbo-parser

相关推荐