清华大学《2021中国搜索引擎创新发展评估报告》(完整版.pdf )以下仅展示部分内容
2022年1月,清华大学新闻与传播学院新媒体研究中心发布了《2021中国搜索引擎创新发展评估报告》(以下称为《报告》)。
《报告》分为发展现状、创新阶段、创新评估、大数据洞察、年度典型、痛点趋势、总结展望等七大方面,聚焦于搜索引擎的创新发展,多维解读国内主流搜索引擎创新的关键痛点和未来趋势。
《报告》基于CFTE模型,采用AI+大数据技术,从内容、功能、技术、生态四个层面全方位评估了搜索引擎创新发展现状。并从提及度、关注度、美誉度、风险度四方面对搜索引擎相关舆论生态进行了多维分析。
01
发展现状
五维驱动搜索引擎创新能力
《报告》认为,搜索引擎创新驱动的核心动力在于政策端、社会端、用户端、技术端、市场端五个方面:
1.政策端,互联网行业既具有绿色基因也具备绿色使命,一方面,科技行业本身自带“绿色属性”;另一方面,海量存储数据将持续消耗电力能源,同样涉及到碳排放问题。置身“双碳”目标的发展浪潮下,互联网科技企业应以开放的心态,携手生态系统中的各方合作伙伴,共同致胜长远。
2.社会端,由于“线上中国”的搭建,基于信息共享性、价值引导性、功能可扩展性和场景适配性,社会催生了许多搜索引擎创新服务场景。
3.用户端,后疫情时代,如何及时有效获取高质量的信息内容显得至关重要,用户渴望获得高质量的信息与交互体验。搜索结果的关联性、真实性及其呈现方式和数据安全等因素,直接或间接影响着用户对高质量信息获取的要求。
4.技术端,随着技术的不断革新,信息输入、处理、输出方式不断地改变,推动了信息“通感互联”。
5.市场端,由内容生产、用户搜索、信息整合、传播渠道、用户反馈和审核运营六方面组成的生态闭环覆盖了数据市场立体全域。
02
创新阶段
技术助推产品形态三次“反卷”
《报告》提出,搜索引擎的创新发展分为了三个阶段:
1.PC时代,搜索引擎是传统互联网时代用户面对海量信息的主要入口,经历了目录导航时期、链接分析时期和链接分析时期三个时期。
2.移动媒体时代,搜索引擎不再局限于某一个网站端口,搜索方式也从用户主动获取的框搜索向平台主动推荐的个性智能化方式转变。但是如何平衡商业化内容呈现、提升信息价值则是其矛盾所在,同时也存在用户信息安全的问题和隐私泄露的风险。
3.元宇宙时代,搜索引擎打破了虚实的界限,从数据的计算、存储及传输三项指标出发,打破了低质量的简单搜索和精准推送带来的信息茧房,打造开放、平等的搜索生态系统和高度自治的数据信息管理方式。
《报告》认为,2021年是元宇宙的元年。当下我国的搜索引擎发展正处于由移动媒体时代向元宇宙的过渡状态。数字孪生、VR、AR、MR等技术的应用,将进一步推进搜索引擎在用户体验、隐私风险管理、知识产权保护、行业垄断管理、算法算力技术等方面的进步和革新。
03
创新评估
搜索引擎CFTE评估数据画像
《报告》基于CFTE模型对360搜索、百度、夸克、搜狗搜索、头条搜索和中国搜索六大搜索引擎进行了创新评估,主要采用基于AI+大数据的多层次指标测量方法,从内容(Content)、功能(Function)、技术(Technology)、生态(Ecolony)四个层面全方位评估了搜索引擎创新发展现状:
1.内容层,六大搜索引擎响应网络“清朗”系列专项行动号召,竞相在内容导向清朗度方面发力,中国搜索、夸克搜索和头条搜索在这一方面表现高于同类平均得分。其中,中国搜索作为以新华社、人民日报等七家央媒为代表联手创立的综合性国家权威搜索引擎,其信息源覆盖各大主流媒体,新闻客观性、完整性、丰富性优势显著,并在垂直搜索领域精进深耕。中国搜索和头条搜索在结果的客观真实性方面表现较为突出。而百度搜索凭借多年的用户流量积累,在数据资源开发利用方面惠及企业及用户端。
2.功能层,头条搜索网页版首页即有明显的无障碍操作入口,通过点击即可进入无障碍模式,功能包含常见的语速及阅读方式选择、进入盲道等19种语言网站快捷服务。并且在2021年各搜索引擎平台迭代创新能力方面,整体表现较为均衡。搜狗、头条、360和百度搜索浏览器以bug修复为主,中国搜索和夸克搜索在全新功能推出指标得分占优。
3.技术层,各大搜索引擎在技术层均有所突破,前沿技术“无人区”也正在开拓。中国搜索不仅推出了5G消息产品,还自主开发了区块链技术,在版权存证、智能检测、侵权取证等方面,为媒体版权联盟会员等提供服务。而百度在AI驱动领域已实现服务个人、服务企业和服务社会三方向的融合发展。
4.生态层,各大搜索引擎精准产品营销、锁定用户圈层,共同打造高质量信息生态。其中,夸克借势高考,提供了针对考生提供估分、志愿填报、专业选择等一站式服务。
04
大数据洞察
2021年中国搜索引擎热门话题
《报告》通过抓取2021年全网6384486条数据,对搜索引擎相关热门话题进行词频、热度、情感倾向等多维度分析。从提及度、关注度、美誉度、风险度四方面进行了大数据洞察:
1.提及度,“内容”“用户”“版权”等成为2021年全网针对搜索引擎提及最多的关键词,可见搜索引擎作为信息聚合平台,在提升内容和用户地位的同时,也提高了网民的媒介素养。知识生产、版权保护在网民观念中越来越重要。
2.关注度,5G和AI成为2021年网民最为关注的搜索引擎技术应用,而隐私数据依旧是网民的对于搜索引擎最为担忧的问题。智能家居和适老化话题2021年首次进入搜索引擎相关话题Top10,中国网民今年更关心搜索引擎带来的“智能生活”。
3.美誉度,无障碍搜索、青少年搜索和适老化搜索是2021好评率最高的话题。网民更关注社会价值,对搜索引擎的关注逐渐从“高速发展”向“高质量发展”转变。
4.风险度,“数字监视”依旧是搜索引擎的技术“原罪”,个人信息被收集、个人隐私被泄露、广告如影随形等科技巨头无节制使用用户数据的行为,严重影响用户口碑和良搜索生态建设。
05
年度典型
中国搜索引擎创新案例合集
《报告》对六大搜索引擎的创新典型案例进行了汇总。发现:
360搜索主要关注性能安全方面,并且注重社群创新,推出了青少年搜索、无追搜索和青云守护计划。
百度搜索注重全方位搜索,不仅支持深度学习,推出了百度大脑7.0、昆仑芯2代和AI原生云计算理念,还跨行业合作构建智能生态系统如无人车出行等,并且注重适老性功能、助力减轻老年群体数字鸿沟。
夸克聚焦新生代用户,以用户需求为核心,在教育行业做出了夸克文档、夸克考研、夸克高考等探索。搜狗的实用功能进行了升级,不仅打造了全球首个手语AI合成主播小聪,还正式链接腾讯,打造全新信服线。
头条搜索集中打造个性化智能推荐,集中打造用户细分下优质信息精准分发。
中国搜索则致力打造清朗网络空间、创造高质量信息生态,不仅是国内首创区块链版权平台和首个面向青少年的全方位搜索生态系统,也是5G搜索的先行者。
06
痛点趋势
智能化破圈迭代,未来已来
《报告》指出了搜索引擎创新发展的四个痛点和四大发展趋势:
痛点:
1.角色定位,搜索引擎巨头的先发优势和技术优势让其掌握了大量关键数据,应警惕其角色定位从内容呈现者转向内容控制者。
2.功能定位,大部分搜索引擎在结果呈现方面没有明显的虚假信息风险提示或信息核查标示,同时缺乏权威有效的信源等级分类。应鼓励搜索引擎通过算法搭建自查自检系统,让搜索引擎摆脱商业模式与新闻治理间的矛盾,逐步完成从信息服务商到把关人的定位转变。
3.技术难点,当下搜索引擎面临着严峻的网络数据安全挑战,如何解决用户数据安全和数据信息流通间的矛盾,是搜索引擎面临的核心技术难点。
4.普惠性,面向老年人、青少年、残障人士等特殊群体的功能创新仍有较大提升空间。
趋势:
1.内容端,坚持正向舆论导向,构建积极和谐社会。既要走互联网+群众路线,讲好中国故事、传播中国声音,也要通过积极强化平台纠偏审丑的能力,为用户树立良好的价值取向和道德观念。
2.功能端,搜索形式应更加多样,垂直领域要持续细分,不仅仅是寻找信息,也能帮助用户解决生产生活中遇到的问题。
3.技术端,智能交互、5G+AI技术群、大数据、区块链、NLP等技术的攻关,降低了用户通过搜索获取有效信息和解决问题的难度,同时增强了搜索引擎信息精准分发及投放的能力。让搜索引擎从单向的人找信息到双向的人和信息互相匹配成为可能。
4.生态端,通过竞争合作新形态来打破孤岛效应,打造信息聚合新场景,向着多媒体、多平台、多语种技术领先、体验优良的一站式搜索引擎集群发展。降低用户搜索成本、全方位提升搜索质量。
07
总结展望
搜索引擎无处不在,大有可为
《报告》的最后对搜索引擎的创新发展提出了三点展望:
1.时空多元布局:搜索场景、端口、形式可进一步拓宽,不局限于搜索框,在任何时空场景、虚实端口均可搜索。
2.硬件搭载智能化信息:人们通过可穿戴设备等智能终端,借助AI搜索引擎实时获取信息,与万物互联正在成为一种新型交互方式。
3.涌现全新商业业态:随着未来用户与资本大量涌入元宇宙空间,虚拟人、虚拟资产、虚拟场景等大量涌现,搜索引擎将成为融通虚实的新入口,通过嫁接虚实“人-货-场”衍生出全新商业业态。