数据集简介

数据集组成

  • 类别数量
    • 数据集包括 50 个字母表(alphabet,可以理解为「大类」)。
    • 每个字母表包括数量不等的手写字符(character,可以理解为「小类」),总计 1623 个手写字符。
    • 每个手写字符包括 20 个字符样本(由不同的人在线绘制),共计 1623 * 20 = 32460 个字符样本。
  • 数据内容
    • 每个字符样本都包括对应的图片和绘制的笔画数据;
    • 图片:灰度图,.png 格式,分辨率 105x105
    • 绘制笔画数据:坐标序列 [x, y, t],时间 (t) 以毫秒为单位。
  • 数据切分:各个任务的切分情况不同,见下文。
  • 简单统计:
    • 若将拥有 x 个字符的字母表的数量 y 表示为 x (y),则统计各个字母表包含的字符数量,结果为 14 (2)、16 (1)、17 (1)、20 (2)、22 (2)、23 (2)、24 (2)、25 (1)、26 (11)、28 (1)、29 (1)、30 (1)、33 (2)、34 (1)、40 (4)、41 (3)、42 (2)、43 (1)、45 (3)、46 (2)、47 (2)、48 (1)、52 (1)、55 (1)

任务一:One-shot classification

任务描述

  • 任务内容:展示一个字母的一张图片,要求选择同一个字母的其他图片
  • 数据集划分
    • 作者在论文中提出了两种数据集划分的方式,但是在后来都没有被广泛采用。
    • 相比之下,Santoro 等人在 Meta-learning with memory-augmented neural networks (ICML 2016) 中提出了一个新的更简单的划分用于 few-shot learning,此后该领域的工作基本都是沿用该划分。

Original & Within Alphabet

  • 官方划分
    • Background set(理解为训练集):来自 30 个字母表的 964 个字母
    • Evaluation set(理解为测试集):来自剩下的 20 个字母表 的 659 个字母

Background Set

 1
 2
 3
 4
 5
 6
 7
 8
 9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
Alphabet_of_the_Magi: 20
Anglo-Saxon_Futhorc: 29
Arcadian: 26
Armenian: 41
Asomtavruli_(Georgian): 40
Balinese: 24
Bengali: 46
Blackfoot_(Canadian_Aboriginal_Syllabics): 14
Braille: 26
Burmese_(Myanmar): 34
Cyrillic: 33
Early_Aramaic: 22
Futurama: 26
Grantha: 43
Greek: 24
Gujarati: 48
Hebrew: 22
Inuktitut_(Canadian_Aboriginal_Syllabics): 16
Japanese_(hiragana): 52
Japanese_(katakana): 47
Korean: 40
Latin: 26
Malay_(Jawi_-_Arabic): 40
Mkhedruli_(Georgian): 41
N_Ko: 33
Ojibwe_(Canadian_Aboriginal_Syllabics): 14
Sanskrit: 42
Syriac_(Estrangelo): 23
Tagalog: 17
Tifinagh: 55

Evaluation Set

 1
 2
 3
 4
 5
 6
 7
 8
 9
10
11
12
13
14
15
16
17
18
19
20
Angelic: 20
Atemayar_Qelisayer: 26
Atlantean: 26
Aurek-Besh: 26
Avesta: 26
Ge_ez: 26
Glagolitic: 45
Gurmukhi: 45
Kannada: 41
Keble: 26
Malayalam: 47
Manipuri: 40
Mongolian: 30
Old_Church_Slavonic_(Cyrillic): 45
Oriya: 46
Sylheti: 28
Syriac_(Serto): 23
Tengwar: 25
Tibetan: 42
ULOG: 26

Original & Within Alphabet (Minimal)

TODO

Augmented & Between Alphabet

  • Few-shot learning 常用划分
    • 无视字母表(alphabet),直接从 1623 个字母(character)里面随机抽 1200 个字母别作为训练集,剩下的 423 个字母作为测试集。
    • 对训练集进行数据增强(旋转 90°、180°、270°),构造了 4800 个训练集类别。

参考

Code

Papers