导入单个专利文件

openclaw openclaw解答 2026-04-09 4

我来介绍 OpenClaw 的文件导入功能，OpenClaw 是一个用于处理专利数据的工具,主要用于专利文本的抽取和分析。

导入单个专利文件-第1张图片-OpenClaw下载官网 - OpenClaw电脑版 | ai小龙虾

主要文件导入方式

命令行导入

# 导入整个目录
openclaw import --dir ./patents/
# 指定输出格式
openclaw import patent.pdf --output json

支持的格式

XML (USPTO、EPO、WIPO 格式)
PDF 专利文档
TXT 文本文件
ZIP 批量专利包

Python API 导入

from openclaw import PatentImporter
# 创建导入器实例
importer = PatentImporter()
# 导入单个文件
patent = importer.import_file("patent.xml")
# 批量导入
patents = importer.import_batch("./patent_folder/")
# 导入并转换为特定格式
data = importer.import_file("patent.pdf", output_format="dict")

配置文件导入

# config.yaml
import:
  input_dir: ./input/
  output_dir: ./processed/
  formats:
    - xml
    - pdf
  batch_size: 50

openclaw import --config config.yaml

处理不同类型专利

USPTO 专利

from openclaw.formats.uspto import USPTOImporter
importer = USPTOImporter()
patent = importer.load("us_patent.xml")

EPO 专利

from openclaw.formats.epo import EPOImporter
importer = EPOImporter()
patent = importer.load("ep_patent.xml")

高级选项

批量处理

# 并行处理多个文件
from openclaw import BatchImporter
importer = BatchImporter(workers=4)
results = importer.process_directory(
    "./patents/",
    callback=lambda p: p.extract_claims()
)

自定义解析器

from openclaw.parsers import BaseParser
class CustomParser(BaseParser):
    def parse_title(self, document):
        # 自定义标题解析逻辑
        pass
importer = PatentImporter(parser=CustomParser())