Keras中关于Recurrent Network的Padding与Masking

在使用RNN based model处理序列的应用中,如果使用并行运算batch sample,我们几乎一定会遇到变长序列的问题。 通常解决变长的方法主要是将过长的序列截断,将过短序列用0补齐到一个固定长度(例如max_length)。 最后由n个sample组成的dataset能形成一个shape == (n, max_length)的矩阵。然后可以将这个矩阵传递到后续的模型中使用。 然而我们可以很明显,如果用0或者其他整数补齐,势必会影响到模型自身(莫名其妙被输入很多个0,显然是有问题的)。有什么方法能够做到“能够使用一个二维矩阵作为输入数据集,从而达到并行化的同时,还能让RNN模型自行决定真正输入其中的序列的长度”。 和其他很多框架一样,Kears提供了Masking的方法。这个方法要配合Embedding层使用。我们先来看一下Embedding的文档: Embedding Arguments input_dim:

[读论文]Visual Translation Embedding Network for Visual Relation Detection

Metadata 文章标题: Visual Translation Embedding Network for Visual Relation Detection 作者: Hanwang Zhang, Zawlin Kyaw, Shih-Fu Chang, Tat-Seng Chua 文章发表: CVPR 2017 下载地址: CVPR 2017, arXiv 2017.02 Intro 这篇文章的主要目标是从图片中抽取一些实体之间的相互关系。例如下面这张图: 这篇文章提出了一个叫做VTransE (Visual

博客迁移

趁这几天不是那么忙,把blog数据迁移了一下。 现在用的是Azure VM B1S主机。 博客系统从以前的Ghost中文版0.7.4升级到了最新的官方英文版1.12.3。 可以直接从旧版导出数据,然后用Ghost-CLI部署新版之后导入。不过新版默认使用MySQL存数据(也可以手动设置SQLite)。 由于Azure流量非常贵,所以我使用了七牛云存储的产品,不但能将图片流量引流,同时还能自带CDN功能(或许以后会迁移到Azure Blob Storage上)。现在的博客集成的是七牛云存储的上传插件。这个插件用起来很方便,作为adapter插入到ghost系统中,并不需要直接修改原始Ghost的代码。同时配置文件只需要config.xxx.js即可。 由于官方版Ghost对中文支持并不太好,自带的模板显示中文会有异常。所以基于wenkeShi修改的中文版的caspro模板进行了一些调整。 除此之外,现在使用了disqus评论系统。