徐土豆
关注
已关注
认证:优质创作者
236
文章
0
视频
51
粉丝
467
获赞
全部投稿
【论文极速看】ERNIE-VIL 一种基于场景图解析的多模态表征方法
ERNIE [1,2,3]是百度提出用于对文本进行建模的模型,为了对图文信息进行多模态建模,百度在后续还提出了ERNIE-VIL模型[4]。ERNIE-VIL模型的建模思路很直接,作者认为图片信息主要
1星期前
语义标签(Semantic label)与多模态模型的一些关系
在分类任务中,我们的标签通常是“硬标签(hard label)”,指的是对于某个样本,要不是类别A,那么就是类别B,或者类别C等等,可以简单用one-hot编码表示,比如[0,1,0], [1,0,0
2星期前
BLIP2——采用Q-Former融合视觉语义与LLM能力的方法
笔者最近忙于工作,已经很久没空更新博客,刚好最近在回顾一些论文,顺便将其进行笔记。BLIP2的目的是希望将现有可用的(预训练好的)视觉编码器和LLM中进行融合得到MLLM,而如何将视觉语义向量和LLM
3星期前
来自专题:
大语言模型
【论文极速看】ERNIE 3.0 通过用知识图谱加强的语言模型
之前写过『清华ERNIE』 与 『百度ERNIE』 的对比,也着重介绍了下百度的ERNIE系列模型,主要是ERNIE 1.0 [1]和ERNIE 2.0 [2]。就笔者的读后感而言,百度的工作和学术界
11-03 13:47
工作一年时期的土豆总结——复杂度和困难度
复杂度(Complexity)在接触了工业界的应用场景和工作后,我最大的感触就是:复杂度(Complex)。我之所以用复杂度(Complex)而不是困难度(Complication, Difficul
10-22 14:24
【见闻录系列】我所理解的“业务”
业务是什么 以及 技术如何赋能业务从百度词条上看,业务被定义为 [2]:各行业中需要处理的事务,但通常偏向指销售的事务,因为任何公司单位最终仍然是以销售产品、销售服务、销售技术等等为主。“业务”最终的
10-19 11:25
markdown数学公式编辑
目录markdown公式编辑基础知识希腊字母常见操作大全数学符号大全其他markdown公式编辑基础知识在CSDN和大多数markdown编辑器中,用$做为行内公式标志,$$作为行间公式标志,如:示例
10-17 13:58
在linux系统上部署FTP服务时进行权限管理(利用chown,chmod命令实现)
我们有时候需要通过FTP服务进行资源共享,但是经常又希望分发出去的不同的帐号有着不同的访问权限,比如现在有帐号A,B,C,而在资源文件夹内有三个对应的文件夹file_a,file_b,file_c,我
10-09 10:24
python使用日常备忘录
字符串编码python3和python2的一个主要差异就在于字符编码,在python2中声明的字符串默认是bytes字节流,而在python3中声明的字符串默认是unicode字符串,我们用以下代码进
10-08 13:20
【见闻录系列】我所理解的搜索业务二三事
刚工作满一周年,从一年前从零开始接触搜索系统[2],到现在初步对搜索系统有所认识,感觉还是积累了一些也许可以拿来分享的内容。总的来说,笔者认为搜索系统就是由各种打分与条件规则组合成的复杂系统,本文也会
10-05 10:16
暂无内容
全部专题
更多
大语言模型
立体视觉与多视角视觉
卷积神经网络优化与加速,压缩
人体活动与视频分析
多模态模型