-
Notifications
You must be signed in to change notification settings - Fork 0
/
Copy pathtokens.go
99 lines (95 loc) · 1.86 KB
/
tokens.go
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
83
84
85
86
87
88
89
90
91
92
93
94
95
96
97
98
99
package translitbg
var (
// Възстановяването на оригиналната дума не е водещ принцип
STREAMLINED = map[string]string{
// lower case
"а": "a",
"б": "b",
"в": "v",
"г": "g",
"д": "d",
"е": "e",
"ж": "zh",
"з": "z",
"и": "i",
"ѝ": "i",
"й": "y",
"к": "k",
"л": "l",
"м": "m",
"н": "n",
"о": "o",
"п": "p",
"р": "r",
"с": "s",
"т": "t",
"у": "u",
"ф": "f",
"х": "h",
"ц": "ts",
"ч": "ch",
"ш": "sh",
"щ": "sht",
"ъ": "a",
"ь": "y",
"ю": "yu",
"я": "ya",
// upper case
"А": "A",
"Б": "B",
"В": "V",
"Г": "G",
"Д": "D",
"Е": "E",
"Ж": "Zh",
"З": "Z",
"И": "I",
"Ѝ": "I",
"Й": "Y",
"К": "K",
"Л": "L",
"М": "M",
"Н": "N",
"О": "O",
"П": "P",
"Р": "R",
"С": "S",
"Т": "T",
"У": "U",
"Ф": "F",
"Х": "H",
"Ц": "Ts",
"Ч": "Ch",
"Ш": "Sh",
"Щ": "Sht",
"Ъ": "A",
"Ь": "Y",
"Ю": "Yu",
"Я": "Ya",
}
STREAMLINED_TOKENS = map[string]string{
// Буквеното съчетание „ия“, когато е в края на думата, се изписва и предава чрез „ia“
"ия": "ia",
"Ия": "Ia",
"иЯ": "iA",
"ИЯ": "IA",
}
// uppercase cyrillic character to its uppercase latin combo equivalent
STREAMLINED_CYR2COMBO_UC = map[rune]string{
1046: "ZH", // Ж
1062: "TS", // Ц
1063: "CH", // Ч
1064: "SH", // Ш
1065: "SHT", // Щ
1070: "YU", // Ю
1071: "YA", // Я
}
// БЪЛГАРИЯ
BULGARIA_CYR_UP = []rune{1041, 1066, 1051, 1043, 1040, 1056, 1048, 1071}
// българия
BULGARIA_CYR_LOW = []rune{1073, 1098, 1083, 1075, 1072, 1088, 1080, 1103}
// BULGARIA
BULGARIA_LAT_UP = []rune{66, 85, 76, 71, 65, 82, 73, 65}
// bulgaria
BULGARIA_LAT_LOW = []rune{98, 117, 108, 103, 97, 114, 105, 97}
)