Что думаешь? Оцени!
3月3日,上海交通大学等单位在《自然·生物医学工程》(Nature Biomedical Engineering)发表论文An ophthalmic video foundation model for surgical recognition and navigation with wet-lab porcine eye validation,报告他们研发了一款专为眼科显微手术的识别和导航而设计的视频基础模型(OVFM)。其采用自监督视觉变换器架构,在包含144种手术类型、110万段视频片段的眼科视频数据集上完成训练,习得眼科手术的时空运动特征。研究团队采用知识蒸馏技术,在保持模型精度的同时缩减模型规模,使其可部署于手术显微镜设备。在十位外科医生开展的猪眼白内障手术中,使用OVFM能有效缩小医师间的技术差距。
,更多细节参见新收录的资料
我的建议:这是Google在AI编程领域的大招。虽然还年轻,但Google的投入力度很大,未来值得关注。特别是它的「Agent Manager」概念很有意思——你可以同时让多个AI帮你干活。如果你是Google全家桶用户,强烈建议试试。
表面上看,“狂飙突进”仍在加速,甚至每一次破纪录都像是新的指数级增长曲线的起点。