信息洪水来袭?阿里云 PDS 智能速览,1分钟掌握文档视频核心知识!
当您或者您所在的组织有大量的文档/视频资料时,如何快速提取这些文档/视频资料内的信息,快速学习到其中的知识将是一个很大的挑战。
阿里云企业网盘 PDS 基于当前先进的大语言模型以及多模态大模型的能力,提供了对文档/视频类文件的深度解析能力,通过这个能力能快速的了解文档或视频的内容,帮助您快速完成材料的学习,另外还提供了针对文件的问答功能,通过Agent帮助您进行更深入的理解。
智能速览能力主要面向于知识密集型的文件开发的一种快速信息提取和总结的能力,主要面向的文件类型有两种:文档和视频,尤其是论文、教程文档、授课视频、企业培训视频、操作视频等。
针对文档的智能速览
您可以指定一篇文档,使用文档智能速览的功能完成文档的全文摘要、章节总结等功能。
○ 关键词提取:自动提取文章中的关键词。
○ 全文总结摘要:对文档的全文进行总结,获取全文的摘要信息。
○ 章节总结:如果文章是有层级结构的,可以针对每个文章的每个层级做分章节总结。
○ 文档内容提取:对文档中的段落、图片、表格等元素进行自动的解析和提取。
○ 问题导读:根据文章的内容,启发式的总结若干文章要点,以问题-答案的形式呈现。
如果是论文型的文档,还可以提取论文中的方法介绍、实验介绍、结论介绍等。
针对视频的智能速览
如果您有一个教学类视频,您也可以利用PDS提供的视频智能速览功能实现对视频的分析、总结和信息提取等。
○ 视频拆解:利用AI算法对视频进行拆解,主要是针对视频内容维度做的拆解,比如根据画面场景的变化或者根据视频讲述内容的变化等将视频拆为多个段落;
○ 视频语音转文字:利用ASR技术将视频中的语音转为文字;
○ 段落总结:结合视频的分段,对每一个片段的视频内容;
○ 问题导读:根据视频内容,启发式的总结若干要点,以问题-答案的形式呈现。
基本原理
对于文档/视频的智能速览能力分为两个环节,第一个是解析环节,另一个是总结环节。针对不同的类型文件我们使用了多种算法来解析文件。
文档智能速览
要做到对文档内容的总结与速览,第一步是要精确的解析出文档的内容,在这里我们使用了文档版面解析与文字识别等技术,先从文件里按照文档结构解析出结构化的信息。然后通过LLM对文档的内容进行总结、分析、知识点提取等。
视频智能速览
针对视频文件,我们首先处理视频的画面、音频等多个维度的数据,提取每个维度内的有效信息,在这些不同维度元数据的基础上,对数据进行融合分析,获取视频的章节分段、章节总结、语义标签等。完成了视频内容的深度理解。
更多信息,请查看阿里云盘产品首页:
https://www.aliyun.com/product/storage/pds?