书目信息

书名: 视觉问答 
作者: 吴琦 著 ;王鑫 聂婕 朱文武
出版信息: 北京   电子工业出版社  2024.07
开本页数: 24cm  XVII, 223页
丛书名:
单 册:
中图分类: TP391.41 TP391.413
科图分类:
主题词: 计算机视觉--ji suan ji shi jue--图象处理--基本知识
电子资源:
ISBN: 978-7-121-47531-3
000 02223nam0 22003491 450
001 0110211806
005 20241110211806.0
010    @a978-7-121-47531-3@dCNY118.00
100    @a20240913d2024 em y0chiy0121 ea
101 @achi@ceng
102    @aCN@b110000
105    @aa a 000yy
106    @ar
200 @a视觉问答@Ashi jue wen da@e理论与实践@d= Visual question answering@efrom theory to application@f吴琦 ... [等] 著@g王鑫, 聂婕, 朱文武译@zeng
210    @a北京@c电子工业出版社@d2024.07
215    @aXVII, 223页@c图 (部分彩图)@d24cm
300    @a博文视点
304    @a题名页题其余责任者: 王鹏, 王鑫, 何晓冬, 朱文武
306    @a由Springer Nature Singapore Pte Ltd.授权出版
314    @a吴琦, 阿德莱德大学副教授, 澳大利亚机器学习研究中心视觉和语言实验室主任, 2019-2021年获得ARCDiscovery DECRA Fellowship。2019年被澳大利亚科学院授予罗素奖。2015年获得英国巴斯大学计算机科学博士学位, 2011年获得硕士学位。他的研究兴趣主要是计算机视觉、自然语言处理和机器学习。目前, 他正在研究视觉语言问题, 主要是图像描述、视觉问答 (VQA) 以及视觉语言导航方面。在TPAMI、CVPR、ICCV、ECCV等著名会议和期刊上发表论文100余篇。他还是CVPR、ICCV和NeurlPS会议的领域主席。
320    @a有书目
330    @a本书共5部分, 第1部分介绍在计算机视觉和自然语言处理领域广泛使用的基本方法和技术, 包括卷积神经网络、序列建模和注意力机制等。本书将视觉问答分为图像和视频方法。第2部分将图像视觉问答进一步分为5类, 即联合嵌入、注意力机制、记忆网络、组合推理和图神经网络。此外, 概述基于图像的其他视觉问答任务, 例如基于知识的视觉问答、视觉问答的视觉和语言预训练。第3部分讨论基于视频的视觉问答及其相关模型。第4部分讨论与视觉问答相关的高级任务, 包括具身视觉问答、医学视觉问答、基于文本的视觉问答、视觉问题生成、视觉对话和指代表达理解, 它们是视觉问答任务的扩展。第5部分对该领域进行总结与展望, 讨论视觉问答领域的未来研究方向。
500 10 @aVisual question answering : from theory to application@mChinese
606 @a计算机视觉@Aji suan ji shi jue@x图象处理@x基本知识
690    @aTP391.41@v5
690    @aTP391.413@v5
701  0 @a吴琦@Awu qi@4著
702  0 @a王鑫@Awang xin@4译
702  0 @a聂婕@Anie jie@4译
702  0 @a朱文武@Azhu wen wu@4译
801  0 @aCN@b人天书店@c20240913
905    @aCKNYKJZYXY@b300716376-7@dTP391.41@e1412@f2
    
    视觉问答:理论与实践= Visual question answering:from theory to application/吴琦 ... [等] 著/王鑫, 聂婕, 朱文武译.-北京:电子工业出版社,2024.07
    XVII, 223页:图 (部分彩图);24cm
    博文视点
    
    ISBN 978-7-121-47531-3:CNY118.00
    本书共5部分, 第1部分介绍在计算机视觉和自然语言处理领域广泛使用的基本方法和技术, 包括卷积神经网络、序列建模和注意力机制等。本书将视觉问答分为图像和视频方法。第2部分将图像视觉问答进一步分为5类, 即联合嵌入、注意力机制、记忆网络、组合推理和图神经网络。此外, 概述基于图像的其他视觉问答任务, 例如基于知识的视觉问答、视觉问答的视觉和语言预训练。第3部分讨论基于视频的视觉问答及其相关模型。第4部分讨论与视觉问答相关的高级任务, 包括具身视觉问答、医学视觉问答、基于文本的视觉问答、视觉问题生成、视觉对话和指代表达理解, 它们是视觉问答任务的扩展。第5部分对该领域进行总结与展望, 讨论视觉问答领域的未来研究方向。
相关链接 在五车中查询图书 在当当中查询图书 在豆瓣中查询图书


正题名:视觉问答     索取号:TP391.41/1412         预约/预借

序号 登录号 条形码 馆藏地/架位号 状态 备注
1 716376   300716376   流通五库四楼/ [索取号:TP391.41/1412] 在馆    
2 716377   300716377   流通五库四楼/ [索取号:TP391.41/1412] 在馆