北京智源推出通用视觉 AI 模型 SegGPT:可自动分割影音中的物体

admin 2022-06-30 阅读:105 评论:0
,▲图源 Arxiv,据称,SegGPT模型是智源通用视觉模型Painter的衍生模型,具备上下文推理能力,在训练完成后只需要提供示例即可推理并完成对应分割任务,包括图像和视频中的实例、类别、零部件、轮廓、文本、人脸、医学图像等,都可以利用...
,▲图源 Arxiv,据称,SegGPT模型是智源通用视觉模型Painter的衍生模型,具备上下文推理能力,在训练完成后只需要提供示例即可推理并完成对应分割任务,包括图像和视频中的实例、类别、零部件、轮廓、文本、人脸、医学图像等,都可以利用视觉提示词(Prompt)完成分割任务。,,▲图源 Arxiv,SegGPT也拥有支持任意数量视觉提示的推理能力。能够以第一帧图像和对应的物体掩码作为上下文示例进行自动视频分割,并且可以用掩码的颜色作为物体的 ID,进行自动追踪。, 经过查询知悉,此前 Meta 也发布了其基于AI的SegmentAnythingModel(SAM)模型,具有识别和分离图像和视频中特定对象的能力。而威斯康辛麦迪逊、微软、港科大等机构的研究人员也推出SEEM 模型,通过不同的视觉提示和语言提示,一键分割图像、视频。IT之家的小伙伴们可以从这里访问模型的论文链接。, 5 月 31 日消息,在2023年中关村论坛人工智能大模型发展论坛中,北京智源人工智能研究院推出了旗下通用分割模型 SegGPT(SegmentEverythingInContex)。
版权声明

本文仅代表作者观点,不代表百度立场。
本文系作者授权百度百家发表,未经许可,不得转载。

分享:

扫一扫在手机阅读、分享本文

热门文章
  • 我国科研人员开发出可精准检测与治疗癌症的纳米粒子

    我国科研人员开发出可精准检测与治疗癌症的纳米粒子
    这是一种能够实现癌症精准检测与治疗的纳米粒子,可显著降低癌症检测治疗过量使用药物带来的副作用。IT之家注,相关研究成果近日已发表于国际知名学术期刊《先进材料》(DOI:10.1002/adma.202211337)。,这种纳米粒子通过在肿瘤中不断变形,延长了粒子内的药物在肿瘤中的驻留时间、增强了药物在肿瘤中的穿透性,以极低的药物剂量实现了癌症光动力疗法的长时磁共振成像检测与高效治疗。,,图源 Pixabay,简单来说,药物过量是造成癌症检测与治疗副作用大的主要原因。这是因为现...
  • 微软文档处理软件 Word 新增缩放快捷组合方式

    微软文档处理软件 Word 新增缩放快捷组合方式
    ,目前 Windows 和 macOS 版 Word 应用中,用户有两种方式来调整页面大小,一种是通过右下角的缩放控制器来调整页面大小;另一种是按住“Ctrl”按键,然后配合鼠标滚轮进行缩放。对于部分喜欢纯键盘操作的用户来说,上述两种方式还不够方便。,微软在引入新的缩放快捷方式之外,还更改了现有的一些快捷方式, 汇总如下:,特性 新快捷方式 (Windows) 新快捷方式 (Mac) 放大“Ctrl”和“+”组合键“CMD”和“+”组合键缩小“Ctrl”和...
  • 行业地位

    行业地位
    机电之家累计投入人民币2亿元左右。是国内较早一批互联网平台,并一直专注于工业机电领域。旗下拥有众多机电行业垂直型门户,已有注册用户1500万。经过近十六年的积累和沉淀,已掌握机电行业及企业的大量信息,并形成行业闭门展示中心及行业非常稀缺的资源,是机电人获取行业资源,扩大圈子的一条渠道。...
  • 车辆进出管理发送短信

    车辆进出管理发送短信
    车辆管理系统中集成金笛短信设备,在每辆车辆出场/回场、读卡时通过金笛 M1203A向指定车管人员手机号发送一条通知短信,建立起更为健全的车辆管理体系,严格派车制度,杜绝了人管人的弊端。...
  • 小区IC卡改蓝牙系统

    小区IC卡改蓝牙系统
    本发明涉及智慧社区领域,尤其涉及一种蓝牙门禁设备、蓝牙终端、蓝牙门禁管理系统及方法。背景技术:在数字化技术和网络技术飞速发展的今天,门禁技术也得到了迅猛发展,它早已超越了单纯的门道及钥匙管理,逐渐发展成为一套完整的出入管理系统,成为解决重要部门出入口实现安全防范管理的有效措施,适用各种机要部门,如智能化小区、银行、宾馆、机房、军械库、工厂等。在目前的蓝牙门禁管理系统中,用户一般使用IC卡或蓝牙终端(装载有相应APP)来实现门禁设备的授权开门。但是,在使用IC卡开门时,需要用户...
标签列表