1. 本选题研究的目的及意义
近年来,随着人工智能技术的飞速发展,深度学习和自然语言处理技术的结合在各个领域取得了显著的成果,其中包括将图像和文本跨模态关联起来。
图像和文本都是人类表达和记录信息的重要方式,将二者结合起来,可以实现更全面、更深入的信息理解和表达。
本选题“看图写诗”--基于图像内容的古诗检索,旨在探索如何利用计算机技术理解图像内容,并检索出与之语义相关的古诗词。
2. 本选题国内外研究状况综述
近年来,跨模态检索成为了研究热点,国内外学者在图像与文本的跨模态检索方面取得了丰富的成果。
1. 国内研究现状
国内学者在图像识别、自然语言处理和跨模态检索等方面做了大量研究。
3. 本选题研究的主要内容及写作提纲
1. 主要内容
本研究的主要内容包括以下几个方面:
1.图像内容分析:研究如何利用计算机视觉技术提取图像中的语义信息,例如图像中的物体、场景、颜色、情感等。
2.古诗语义理解:研究如何利用自然语言处理技术理解古诗词的语义内容,例如诗歌的主题、意境、情感、人物、事件等。
4. 研究的方法与步骤
本研究将采用以下方法和步骤:
1.文献调研:阅读相关领域的文献,了解图像识别、自然语言处理、跨模态检索和古诗词研究的最新进展,为本研究提供理论基础和技术参考。
2.数据收集与处理:收集图像和古诗词数据,并对数据进行清洗、标注和预处理,为模型训练和测试做准备。
3.模型构建:设计基于图像内容的古诗检索模型,包括图像特征提取模块、古诗语义理解模块和图像-诗歌匹配模块。
5. 研究的创新点
本研究的创新点在于:
1.提出了一种基于深度学习的图像内容分析方法,能够有效地提取图像中的语义信息,并将其用于古诗检索。
2.提出了一种基于transformer的古诗语义理解方法,能够更好地捕捉古诗词的语法结构和语义信息,提高图像与古诗词之间语义匹配的准确率。
3.构建了一个完整的基于图像内容的古诗检索系统,为用户提供了一种全新的古诗词欣赏和创作方式。
6. 计划与进度安排
第一阶段 (2024.12~2024.1)确认选题,了解毕业论文的相关步骤。
第二阶段(2024.1~2024.2)查询阅读相关文献,列出提纲
第三阶段(2024.2~2024.3)查询资料,学习相关论文
7. 参考文献(20个中文5个英文)
1.张涛,彭宇行,谢浩,等.融合视觉情感分析的图像古诗生成[j].计算机辅助设计与图形学学报,2022,34(09):1473-1483.
2.黄鑫,王晓龙,叶翰辰,等.基于深度学习的图像诗歌生成模型综述[j].计算机科学,2022,49(08):1-12.
3.张艳,徐宝,王萌.基于深度学习的多模态诗歌生成研究综述[j].计算机应用研究,2021,38(10):2913-2919.
课题毕业论文、文献综述、任务书、外文翻译、程序设计、图纸设计等资料可联系客服协助查找。