Cln是什么病:在kaggle糖尿病视网膜病变检测第2位解决方案神经网络中“大小”是什么意思

link: https://www.kaggle.com/c/diabetic-retinopathy-detection/discussion/15617 Github: https://github.com/sveitser/kaggle_diabetic

你好,我是 CNN 的新手,最近我正在研究这个解决方案。作者画了一张他的小组设计的网络表。单位、过滤器和步幅对我来说都有意义,但我只是不知道“大小”是什么意思。

我认为它应该是图像大小,但有两个原因不应该:

正如他们在报告中描述的那样,他们只是将原始 imgaes 裁剪为 128x128,256x256,512x512 像素,并且没有进行任何其他 iamge 预处理。

阅读他们的代码(从 Github 链接)后,我发现他们的 InputLayer 设置是:

(InputLayer, {'shape': (None, 3, cnf['w'], cnf['h'])}),

这证实了他们竞争报告中的描述。

因此,我认为输入大小应该是 3x128x128,而不是 448。

这里是我的问题:

1.如果输入图像大小不是 448,则 448 是什么意思?

2.如果这意味着批量大小,为什么他们会选择 448?和

3.为什么他们会让批量从第 1 层到第 19 层减少(基本上 / 2)到 224 111 56 27 13 6 2?

3

linked tablesize列是指层中激活的垂直和水平尺寸。

这些是来自 repo 表中的网络的完整配置:

Network A Network B

这两个都有输入宽度和高度 448,即输入层的size是 448。

我们可以使用以下公式来计算卷积层激活的垂直和水平维度:

ACTIVATION_SIZE = (INPUT_SIZE − FILTER_SIZE + PADDING_PREV + PADDING_AFTER) / STRIDE + 1

我们可以从上面链接的网络配置中获取输入大小,过滤器大小和步幅参数。由于他们使用的是 Lasagne 的早期开发版本,因此很难准确辨别他们使用的填充类型,因此我们必须在那里进行一些假设。

对于网络 A:

INPUT_SIZE = 448
FILTER_SIZE = 5
STRIDE = 2

使用上述公式,如果PADDING_PREV = 2PADDING_AFTER = 1(或相反),则激活大小为 224。由于根据它们的表,第一卷积层的大小为 224,因此我们可以确定我们正确解释了参数。

对于网络 B:

INPUT_SIZE = 448
FILTER_SIZE = 4
STRIDE = 2

如果两个填充都为 1,这将导致激活大小为 224,如表所示。

总之,作者报告了他们的 512x512 图像网络的架构,并省略了将这些图像调整为 448x448 分辨率的细节以及它们如何应用填充。这在计算机视觉社区中是常见的,人们总是可以依靠上面的公式来验证这些细节。

本站系公益性非盈利分享网址,本文来自用户投稿,不代表边看边学立场,如若转载,请注明出处

(101)
机顶盒中心服务器连接异常:dvb三元组在机顶盒中的用法是什么
上一篇
搜索引擎的分类:.net的搜索引擎(net search engine)
下一篇

相关推荐

  • comeandgetyourlove音乐爱就在你身边

    Come and Get Your Love是一首热门的歌曲,由美国摇滚乐队Redbone演唱。这首歌曲于1974年发行,被收录在他们的专辑《Wovoka》中。歌曲以放克曲风为主,旋律活泼,曲调悠扬,歌词朗朗上口,深受歌迷喜爱。…

    2023-06-29 07:47:31
    0 99 96
  • codeblocks无法编译运行:Codeblocks无法编译运行的解决方案

    codeblocks无法编译运行的原因可能有很多,下面以一段简单的C语言代码为例,来说明codeblocks无法编译运行的情况。…

    2023-07-11 08:01:55
    0 63 64
  • gitlab ci 自动化部署:使用 Gitlab CI 自动化部署提升开发效率

    GitLab CI 自动化部署是一种基于 GitLab CI/CD 的自动化部署方案,可以实现快速、可靠的部署流程。它将代码提交、构建、测试、部署等步骤集成在一起,使得开发者可以更加轻松地完成部署工作。下面是一个示例 .gitlab-ci.yml 文件,可以帮助你实现 GitLab CI 自动化部署:…

    2023-05-20 05:45:38
    0 97 12
  • xl和xe汽车cvt:探索XL和XE汽车的CVT技术优势

    XL和XE汽车CVT是一种变速器,它使用液力变矩器代替传统的机械变速器,以达到更高的效率。它的工作原理是,当发动机输出功率时,液力变矩器就会将这些功率转换为液压能量,然后将能量传递到变速器的输出轴上,从而实现变速。…

    2023-05-16 07:36:03
    0 16 49
  • js添加css:This is a Title

    使用js添加css可以通过修改元素的style属性来实现,具体代码如下:…

    2023-05-27 12:30:24
    0 66 60
  • css 字符间距:### 世界上最美的地方

    示例示例CSS 字符间距是指在文本中的字符之间添加间距,以增强文本的可读性。它可以使文本更容易阅读,也可以使文本看起来更美观。代码示例:…

    2023-04-15 08:45:29
    0 30 71
  • git 删除commit记录:回滚Git Commit记录

    git删除commit记录可以使用git reset命令。使用方法:…

    2023-07-07 04:31:44
    0 53 57
  • java实现tcp:使用Java实现TCP网络编程

    TCP(传输控制协议)是一种面向连接的、可靠的、基于字节流的传输层协议。它使用三次握手来建立可靠的连接,并且在数据传输期间可以检测丢失的数据包并重新发送。…

    2023-01-31 10:33:14
    0 16 68

发表评论

登录 后才能评论

评论列表(11条)