Discuz! Board

 找回密码
 立即注册
搜索
热搜: 活动 交友 discuz
查看: 164|回复: 0

真且保护隐私的合成电子健

[复制链接]

1

主题

1

帖子

5

积分

新手上路

Rank: 1

积分
5
发表于 2024-5-8 14:11:56 | 显示全部楼层 |阅读模式

康记录年月日发布者和研究部云团队研究科学家发布者和研究部云团队研究科学家电子健康记录分析在增强患者护理定量测量临床实践表现和促进临床研究方面具有巨大潜力。基于数据训练的统计估计和机器学习模型可用于预测各种疾病例如糖尿病的概率跟踪患者健康状况以及预测患者对特定药物的反应。对于此类模型研究人员和从业人员需要访问数据。然而在确保数据隐私并遵守患者保密法规例如的同时利用数据可能具有挑战性。传统的数据匿名化方法例如去识别化通常是乏味且昂贵的。此外它们可能会扭曲原始数据集中的重要特征从而显着降低数据的实用性他们还可能容易受到隐私攻击。


我们不必扭曲自己以最能适应计算机局限性的方式进行交互而是可以通过自然的对话来完成各种任务。我对我们在使变得有用和真实方面所取得的进展感到兴奋。月份我们描述了的  格鲁吉亚电话号码列表 工作是一个使用软件基础设施构建的大型亿参数语言模型并在多个上进行训练。的工作表明尽管仅以预测下一个标记为目标进行训练但在大量多语言数据和源代码上训练的大规模语言模型能够提高整个领域的最新技术。各种各样的自然语言翻译和编码任务尽管从未接受过专门执行这些任务的培训。这项工作提供了额外的证据表明增加模型和训练数据的规模可以显着提高能力。参数模型与之前最先进的在套件的项任务上的性能比较。




详情请参阅论文。我们还看到在使用基于源代码而不是自然语言文本数据训练的大型语言模型方面取得了巨大成功可以帮助我们的内部开发人员如增强的代码完成提高开发人员工作效率中所述。通过使用来自亿参数语言模型的各种代码补全建议供名软件开发人员在其中使用该模型我们发现所有代码的来自该模型生成的建议从而减少了编码迭代这些开发人员的时间减少了。我们正在开发它的增强版本并希望将其推广给更多的开发人员。人工智能面临的广泛关键挑战之一是构建能够执行多步骤推理的系统学习将复杂问题分解为更小的任务并将解决方案组合起来解决更大的问题。


回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

Archiver|手机版|小黑屋|DiscuzX

GMT+8, 2026-3-25 00:16 , Processed in 0.051643 second(s), 18 queries .

Powered by Discuz! X3.4

Copyright © 2001-2020, Tencent Cloud.

快速回复 返回顶部 返回列表