此条经验将介绍通过Java编程来读取或提取PPT幻灯片中的文本。
工具/原料
Free Spire.Presentation for Java (免费版)
jar文件导入
1、步骤1:在Java程序中新建一个文件夹可命名为Lib。并将产以下路径中的jar文件复制到新建的文件夹下。

2、步骤2:复制文件后,添加到引用类库:选中这个jar文件,点击鼠标右键,选择“幞洼踉残Build Path” – “Add to Build Path”。完成引用。

Java代码示例(供参考)
1、测试文档如下:

2、import com.spire.presentation.*;import java.io.FileWriter;public class ExtractText { public st锾攒揉敫atic void main(String[] args) throws Exception { //创建Presentation实例 Presentation ppt = new Presentation(); //加载PowerPoint文档 ppt.loadFromFile("test.pptx"); StringBuilder buffer = new StringBuilder(); //遍历文档中的幻灯片,提取文本 for (Object slide : ppt.getSlides()) { for (Object shape : ((ISlide) slide).getShapes()) { if (shape instanceof IAutoShape) { for (Object tp : ((IAutoShape) shape).getTextFrame().getParagraphs()) { buffer.append(((ParagraphEx) tp).getText()); } } } } //保存文本到文本文件 FileWriter writer = new FileWriter("ExtractText.txt"); writer.write(buffer.toString()); writer.flush(); writer.close(); }}
3、运行程序,生成文档,文档读取效果如下所示:
