Discuz! Board

 找回密码
 立即注册
搜索
热搜: 活动 交友 discuz
查看: 82|回复: 0

该专利提供了有关信息源的更多信息这些

[复制链接]

1

主题

1

帖子

5

积分

新手上路

Rank: 1

积分
5
发表于 2023-11-1 14:12:19 | 显示全部楼层 |阅读模式
信息源可以提供有关特定实体的专门搜索结果。 提供此类信息的来源可能以半结构化格式提供,从而可以收集此类数据。它们可能采用数据库的形式,其中数据可以使用数据包装器归纳。该专利继续告诉我们: 实施过程中可以使用一个或多个知识库来识别和注释存储库中的培训文档。 注释包括正面示例和反面示例。
反例可以包括由权重表示的各种确定性级别。 不同级别的确定性可以使用引导训练过程。 一旦模型被训练,针对文档源中的页面的模型就不会被用作训练页面,而是提取新实体和新事实以插入到知识库中。 这听起来像是关系和知识的关联评分排名出现在谷歌之前的一项专利中。

我们没有获得有关知识关联评分方法的大量信息,该专利讨论了机器学习 卡塔尔电话号码数据 和训练集: 数据包装器培训 在一个方面,一种方法包括从一组半结构化网页中识别半结构化网页的训练集,训练集中的半结构化网页是训练页面,并且具有主题实体存在于知识库中。

对于训练集中的每个训练页面,该方法还包括识别训练页面中的目标对象、识别知识库中将训练页面的主题实体连接到其中识别的目标对象之一的谓词、以及注释训练页面。 对于训练页面中标识的至少一些目标对象,注释训练页面包括: 生成提及目标对象的特征集 为提及生成谓词-目标对象对 用相应的示例类型和权重标记每个谓词-目标对象对 该方法还包括使用带注释的训练页面来训练机器学习模型,以从半结构化网页集合中提取新的主题实体和新的事实。



这种训练方法用于数据包装器归纳。 它可能涉及一种系统,该系统至少包括一个处理器和存储训练集生成引擎的存储器。 训练集生成引擎可能会从域的一组半结构化网页中识别出半结构化网页的训练集,并且训练集中的半结构化网页是具有知识库中的主题实体。

该训练集生成引擎可以适用于训练集中的每个训练页面: 识别训练页面中的目标对象 识别知识库中将训练页面的主题实体连接到训练页面中识别的目标对象之一的谓词 通过针对至少一些目标对象提及生成谓词-目标对象对来注释训练页面,其中每个谓词-目标对象对是正例类型、可能负例类型或弱负例类型之一 它似乎比这更详细,还包括以下步骤:

回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

Archiver|手机版|小黑屋|DiscuzX

GMT+8, 2025-9-13 07:42 , Processed in 0.046126 second(s), 18 queries .

Powered by Discuz! X3.4

Copyright © 2001-2020, Tencent Cloud.

快速回复 返回顶部 返回列表