本篇文章主要介绍使用java类库将html转为markdown
java语言html转为markdown
remark
使用方法
- 添加pom依赖
<dependency>
<groupId>com.kotcrab.remark</groupId>
<artifactId>remark</artifactId>
<version>1.2.0</version>
</dependency>
- java代码示例
@Test
public void html2Md() {
Remark remark = new Remark();
String html = "<p><b>测试</b><ul><li>列表1</li><li>列表2</li></ul><p><img src=\"https://static001.geekbang.org/resource/image/cb/55/cb18e672732ab76fc61d60bdf66bf855.png\" alt=\"abc\"></p><a rel="nofollow" href=\"www.baidu.com\">百度</a></p>";
String markdown = remark.convertFragment(html);
System.out.println(markdown);
}
结果
**测试**
* 列表1
* 列表2
![abc][]
百度
[abc]: https://static001.geekbang.org/resource/image/cb/55/cb18e672732ab76fc61d60bdf66bf855.png
缺点
- 图片无法转换成直接可以使用的
- 超链接无法正确提取
- 很久没有维护了
- 高等数学的括号无法正常转换
flexmark
使用方法
- pom.xml
<dependency>
<groupId>com.vladsch.flexmark</groupId>
<artifactId>flexmark-all</artifactId>
<version>0.64.0</version>
<scope>test</scope>
</dependency>
测试用了flexmark-all
,可以根据功能选择自己需要的
2. java示例
@Test
public void html2Md01() {
String html = "<p><b>测试</b><ul><li>列表1</li><li>列表2</li></ul><p><img src=\"https://static001.geekbang.org/resource/image/cb/55/cb18e672732ab76fc61d60bdf66bf855.png\" alt=\"abc\"></p><a rel="nofollow" href=\"www.baidu.com\">百度</a></p>";
FlexmarkHtmlConverter converter = FlexmarkHtmlConverter.builder().build();
System.out.println(converter.convert(html));
}
输出
**测试**
* 列表1
* 列表2
![abc](https://s2.51cto.com/images/blog/202210/13234422_63483256f0c6553301.png?x-oss-process=image/watermark,size_16,text_QDUxQ1RP5Y2a5a6i,color_FFFFFF,t_30,g_se,x_10,y_10,shadow_20,type_ZmFuZ3poZW5naGVpdGk=)
[百度](www.baidu.com)
<br />
存在的问题
- 高等数学公式无法转换
优点
- 更新时间相对较新
- 准确率相对较高
参考
学习交流:513650703