医疗权威资源产品合作指南-如何生产-如何定义医疗权威资源
如何生产-如何定义医疗权威资源【非常重要】
医疗权威资源不限数据类型(一问多答、多轮对话、文章、视频、语音等)。医疗权威资源需要在“页面体验度”、“数据质量度”、“数据权威度”、 “数据原创性”四个方面同时达标。
1. 页面体验度
页面体验主要考察页面整体排版广告等,关乎用户第一眼的视觉体验。为强化规范医疗落地页体验,所有VIP数据落地也必须为“百度医疗定制化结果页”。
优质页面体验标准详见:
https://ziyuan.baidu.com/college/documentinfo?id=2697
https://ziyuan.baidu.com/college/documentinfo?id=2708
2. 数据质量度
数据质量度主要考察页面内容对于标题问题的解答程度,关乎用户是否能从中获得有参考价值的信息。同时辅助考察数据文字化及摘要程度,关于用户的信息获取效率。 数据优质性的标准详情如下:
【优质数据标准:一问多答数据】
● 问题标题:
· 需包含明确的病情描述、问题意图;语句通顺
● 病情描述:
· 需包含详细的患者个人信息(如性别、年龄等)、病情背景、问题意图;语句通顺完整;无明显的信息缺失;无用户敏感信息明文展现露出(如名字、联系方式等)
● 回答质量:
· 回答排序:页面最优质回答排在首位(页面质量将参考全部回答,优质回答数量将影响页面质量)
· 回答者信息:需包含回答者姓名、头像、级别、科室、医院
· 回答内容:优质回答需详尽分析并解答用户问题,对用户有较大的参考价值;语句通顺完整,无恶意截断;无明显的信息缺失
【优质数据标准:多轮对话数据】
● 问题标题:
· 需包含明确的基本病情背景及问题意图;语句通顺完整无恶意截断
● 病情描述:
· 需包含详细的患者个人信息(如性别、年龄等)、病情背景、问题意图;语句通顺完整;无明显的信息缺失;无用户敏感信息明文展现露出(如名字、联系方式等)
● 患者特征标签:
· 提取对话过程中患者提及的相关病症特征
● 医嘱摘要:
· 简要概括诊疗对话过程中医师的分析诊断、医生建议(包括但不限于就诊科室、检查项目、用药、饮食等);需明确满足患者意图;语句通顺,无恶意拼接、截断,无明显的信息缺失
● 回答者信息:
· 需包含回答者姓名、头像、级别、科室、医院
● 对话内容:
· 对话信息详细完整,无明显的信息缺失,详尽分析并解答用户问题对用户有较大的参考价值;无用户敏感信息明文展现露出(如名字、联系方式等)
● 语音信息:
· 可正常播放,音质清晰
● 图片信息:
· 图片信息等隐私处理有明显标识
● 其他杂质信息:
· 无过多与患者病情背景无关或无诊疗价值的信息
【优质数据标准:文章数据】
● 文章标题:
· 文章内容讨论话题或主题明确;语句通顺易理解,有明显的用户价值;结构清晰完整长度适中无截断等行为
● 作者信息:
· 需包含回答者姓名、头像、级别、科室、医院
● 文章摘要:
· 详细概括文章内容精华,语句通顺,段落清晰(仅带有摘要的优质文章,才能获得搜索结果页TOP-ONE强样式展现机会)
● 文章内容:
· 内容丰满,切合主题,无过多无关主题的讨论
· 段落清晰,有良好的行文组织方式,清晰易读
● 文章配图:
· 图片与文章内容强相关,画质清晰有格调,图片大小480*270(仅带有配图的优质文章,才能获得搜索结果页TOP-ONE强样式展现机会)
【优质数据标准:视频数据】
● 视频标题:需包含明确的病情描述、问题意图
● 视频内容:H5端播放体验流畅,详细分析并解答用户问题对用户有较大的参考价值
● 视频长度:时间不超过10分钟(1-8分钟左右为最佳)
● 视频字幕:视频全程配备完整字幕
● 视频画质:画质清晰(标清及以上),视频分辨率为480p,封面比例为16:9,尺寸最小不低于960*540
● 视频音质:音质清晰
● 视频文字摘要:配备详细的文字描述(100字以上),段落清晰,小标题明显(仅带有摘要的优质视频,才能获得搜索结果页TOP-ONE强样式展现机会)
● 视频医生露出:视频中医生露出时长超过50%,露出时始终有医生信息及职称信息的字幕展现
● 医生信息:需包含回答者姓名、头像、级别、科室、医院
● 视频封面图:图片和视频内容强相关,画质清晰有格调,图片大小480*720(仅带有封面配图的优质视频,才能获得搜索结果页TOP-ONE强样式展现机会)
【优质数据标准:语音数据】
● 语音标题:需包含明确的病情描述、问题意图
● 语音内容:H5端播放体验流畅,详细分析并解答用户问题对用户有较大的参考价值
● 语音长度:时间不超过10分钟(1-3分钟左右为最佳)
● 语音音质:音质清晰,比特率>96kbps
● 语音源文件:语音源文件地址(仅带有语音源文件地址的语音数据,才能获得搜索结果页TOP-ONE强样式展现机会)
● 语音文字摘要:配备详细的文字描述(100字以上),段落清晰,小标题明显(仅带有摘要的优质视频,才能获得搜索结果页TOP-ONE强样式展现机会)
● 医生信息:需包含回答者姓名、头像、级别、科室、医院
● 语音封面图:图片和视频内容强相关,画质清晰有格调,图片大小480*270(仅带有封面配图的优质视频,才能获得搜索结果页TOP-ONE强样式展现机会)
【优质数据标准:百科数据】
● 百科标题:需包含明确的医疗实体
● 作者信息:需包含回答者姓名、头像、级别、科室、医院
● 百科摘要:详细概括文章内容精华,语句通顺,段落清晰(仅带有摘要的优质文章,才能获得搜索结果页TOP-ONE强样式展现机会)
● 百科内容:内容丰满(字数不少于1000字),段落清晰,小标题明显
● 百科配图: 图片与文章内容强相关,画质清晰有格调,图片大小480*270(仅带有配图的优质文章,才能获得搜索结果页TOP-ONE强样式展现机会)
【优质数据标准:小贴士数据】
● 小贴士标题:需包含明确的医疗实体
● 作者信息:需包含回答者姓名、头像、级别、科室、医院
● 小贴士内容:内容丰满(字数不少于400字),段落清晰,小标题明显
● 小贴士配图:图片与文章内容强相关,画质清晰有格调,图片大小480*270(仅带有配图的优质文章,才能获得搜索结果页TOP-ONE强样式展现机会)
【优质数据标准:医美日记】
● 日记标题:包含明确的医美项目
● 作者信息:需包含日记作者头像、姓名(id/昵称)
● 项目名称:包含明确的医美项目
● 服务医生信息:需包含医生姓名、级别、医院
● 单篇日记内容:日记照片,需配备详细的文字描述(100字以上)
● 日记本内容:包含术前对比照片,内容丰满(含视频更优),段落清晰,便于用户了解特定医美项目的效果
● 日记配图:图片与日记内容强相关,画质清晰有格调
3. 数据权威度
数据权威度主要考察页面内容作者的专业权威度,关乎用户对信息的信任度和参考度。
数据权威性的标准详情如下:
【权威回答者标准:所有数据类型通用】
● 领域权威:回答者和标题主体领域(科室)匹配
● 级别权威:回答者在其领域拥有较高的认可度
· 一般疾病类:公立三甲医院主治及以上医生、公立非三甲医院副主任及以上医生
· 健康护理类:公立医院副主任及以上护师
· 用药说明类:公立医院副主任及以上药师
· 心理咨询类:国家一级/二级心理咨询师、中国心理学会/中国心理卫生协会会员
· 营养保健类:注册营养师/一级公共营养师、中国营养学会会员、一级健康管理师
· 医学院校研究所类:教授/副教授、研究员/副研究员
● 特别关注:
一问多答数据:只对第一条回答作者进行权威度识别,请确保最权威的回答排在第一位视频数据:推荐三甲医院副主任以上医师
● 温馨提示:
如果存在某些领域(母婴/医美日记等)的权威生产者不在以上描述中,请主动联系百度PM商讨之后调整
数据权威度评分体系详情如《权威度打分体系_20190117.xlsx》
医生职称与医生科室信息提交规范见《医生职称与医生科室信息提交规范_20190117.xlsx》
4. 数据原创性
数据原创性主要考察内容资源的原创程度,内容原创是VIP权威内容的重要要求,该指标关乎生态健康和资源方权益。机制上,我们会周期性地对线上数据进行审查,并对典型的非原创内容进行拒绝或其他打击操作。
数据原创性的标准详情如下:
【数据原创性标准:(所有数据类型通用)】
一般的,出现以下情形的内容数据会被判定为“非原创数据”:
● 抄袭
未经授权转载、复制、大面积摘录其他作者原创内容。
● 刷量
同资源方,大量重复提交相同或相似内容。
● 不当的数据类型转换
利用相同的内容资源,多次生产并提交不同数据类型的内容。
对于被机器策略识别为“非原创”的数据,我们会进行拒绝处理。
【一问多答页面资源方特别关注】
为保证所有优质权威的“一问多答”数据,能够在搜索结果页有异于普通结果的强样式,需要所有有“一问多答”数据的资源方关注并配合以下两件事情:
“一问多答”的页面,医疗PM只取第一条回答做权威度识别,质量度识别将参考页面全部回答
● 如何排序:无论页面如何更新,请确保最优质权威的数据展现在第一位
● 如果有新的优质权威数据替换了原来的第一位数据:请主动重新推送url(连同新的json-ld),以便百度重新抓取
“一问多答”的页面,所有的回答需要包含“医生头像”、“医生姓名”、“医生医院”、“医生级别”、“回答内容”、“回答时间”字段
● 务必保证字段数据的真实性
● 这些字段需要在页面展现
● 同时需要添加在json-ld中
● 保证前端页面展现和json-ld的数据保持完全一致
目录:
1. 为什么要甄选医疗权威资源
2. 有哪些需求需要资源方定向提交/生产数据
3. 如何定义医疗权威资源
4. 医疗权威资源在应用之前将经过何种审核
5. 如何追踪提交数据的收录和应用效果
6. 如何进行问题自查及反馈
来源:百度搜索资源平台 百度搜索学堂