r75190 MediaWiki - Code Review archive

Repository:MediaWiki
Revision:r75189‎ | r75190 | r75191 >
Date:15:10, 22 October 2010
Author:diederik
Status:deferred
Tags:
Comment:
Added mapping between English language name, locale language name and wikipedia domain acronym.
Modified paths:
  • /trunk/tools/editor_trends/languages.py (added) (history)

Diff [purge]

Index: trunk/tools/editor_trends/languages.py
@@ -0,0 +1,606 @@
 2+#!/usr/bin/python
 3+# -*- coding: utf-8 -*-
 4+'''
 5+Copyright (C) 2010 by Diederik van Liere (dvanliere@gmail.com)
 6+This program is free software; you can redistribute it and/or
 7+modify it under the terms of the GNU General Public License version 2
 8+as published by the Free Software Foundation.
 9+This program is distributed in the hope that it will be useful,
 10+but WITHOUT ANY WARRANTY; without even the implied warranty of
 11+MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE.
 12+See the GNU General Public License for more details, at
 13+http://www.fsf.org/licenses/gpl.html
 14+'''
 15+
 16+__author__ = '''\n'''.join(['Diederik van Liere (dvanliere@gmail.com)', ])
 17+__author__email = 'dvanliere at gmail dot com'
 18+__date__ = '2010-10-21'
 19+__version__ = '0.1'
 20+
 21+'''
 22+This file provides mapper between language name and locale language name and
 23+Wikipedia acronym.
 24+Gothic and Birmese are not yet supported, see rows 450 and 554.
 25+'''
 26+
 27+LANGUAGES = {
 28+'English':'en',
 29+'German':'de',
 30+'French':'fr',
 31+'Italian':'it',
 32+'Polish':'pl',
 33+'Japanese':'ja',
 34+'Spanish':'es',
 35+'Dutch':'nl',
 36+'Portuguese':'pt',
 37+'Russian':'ru',
 38+'Swedish':'sv',
 39+'Chinese':'zh',
 40+'Catalan':'ca',
 41+'Norwegian':'no',
 42+'Bokmål':'no',
 43+'Finnish':'fi',
 44+'Ukrainian':'uk',
 45+'Hungarian':'hu',
 46+'Czech':'cs',
 47+'Romanian':'ro',
 48+'Turkish':'tr',
 49+'Korean':'ko',
 50+'Vietnamese':'vi',
 51+'Danish':'da',
 52+'Arabic':'ar',
 53+'Esperanto':'eo',
 54+'Serbian':'sr',
 55+'Indonesian':'id',
 56+'Lithuanian':'lt',
 57+'Volapük':'vo',
 58+'Slovak':'sk',
 59+'Hebrew':'he',
 60+'Bulgarian':'bg',
 61+'Persian':'fa',
 62+'Slovenian':'sl',
 63+'Waray-Waray':'war',
 64+'Croatian':'hr',
 65+'Estonian':'et',
 66+'Malay':'ms',
 67+'Newar':'new',
 68+'Nepal Bhasa':'new',
 69+'Simple English':'simple',
 70+'Galician':'gl',
 71+'Thai':'th',
 72+'Aromanian':'roa-rup',
 73+'Nynorsk':'nn',
 74+'Basque':'eu',
 75+'Hindi':'hi',
 76+'Greek':'el',
 77+'Haitian':'ht',
 78+'Latin':'la',
 79+'Telugu':'te',
 80+'Georgian':'ka',
 81+'Cebuano':'ceb',
 82+'Macedonian':'mk',
 83+'Azeri':'az',
 84+'Tagalog':'tl',
 85+'Breton':'br',
 86+'Serbo-Croatian':'sh',
 87+'Marathi':'mr',
 88+'Luxembourgish':'lb',
 89+'Javanese':'jv',
 90+'Latvian':'lv',
 91+'Bosnian':'bs',
 92+'Icelandic':'is',
 93+'Welsh':'cy',
 94+'Belarusian':'be-x-old',
 95+'Taraškievica':'be-x-old',
 96+'Piedmontese':'pms',
 97+'Albanian':'sq',
 98+'Tamil':'ta',
 99+'Bishnupriya Manipuri':'bpy',
 100+'Belarusian':'be',
 101+'Aragonese':'an',
 102+'Occitan':'oc',
 103+'Bengali':'bn',
 104+'Swahili':'sw',
 105+'Ido':'io',
 106+'Ripuarian':'ksh',
 107+'Lombard':'lmo',
 108+'West Frisian':'fy',
 109+'Gujarati':'gu',
 110+'Low Saxon':'nds',
 111+'Afrikaans':'af',
 112+'Sicilian':'scn',
 113+'Quechua':'qu',
 114+'Kurdish':'ku',
 115+'Urdu':'ur',
 116+'Sundanese':'su',
 117+'Malayalam':'ml',
 118+'Cantonese':'zh-yue',
 119+'Asturian':'ast',
 120+'Neapolitan':'nap',
 121+'Samogitian':'bat-smg',
 122+'Walloon':'wa',
 123+'Chuvash':'cv',
 124+'Irish':'ga',
 125+'Armenian':'hy',
 126+'Yoruba':'yo',
 127+'Kannada':'kn',
 128+'Tajik':'tg',
 129+'Tarantino':'roa-tara',
 130+'Venetian':'vec',
 131+'Western Panjabi':'pnb',
 132+'Nepali':'ne',
 133+'Scottish Gaelic':'gd',
 134+'Yiddish':'yi',
 135+'Min Nan':'zh-min-nan',
 136+'Uzbek':'uz',
 137+'Tatar':'tt',
 138+'Kapampangan':'pam',
 139+'Ossetian':'os',
 140+'Sakha':'sah',
 141+'Alemannic':'als',
 142+'Maori':'mi',
 143+'Egyptian Arabic':'arz',
 144+'Kazakh':'kk',
 145+'Nahuatl':'nah',
 146+'Limburgian':'li',
 147+'Upper Sorbian':'hsb',
 148+'Gilaki':'glk',
 149+'Corsican':'co',
 150+'Gan':'gan',
 151+'Amharic':'am',
 152+'Mongolian':'mn',
 153+'Interlingua':'ia',
 154+'Central Bicolano':'bcl',
 155+'Võro':'fiu-vro',
 156+'Dutch Low Saxon':'nds-nl',
 157+'Faroese':'fo',
 158+'Turkmen':'tk',
 159+'Scots':'sco',
 160+'West Flemish':'vls',
 161+'Sinhalese':'si',
 162+'Sanskrit':'sa',
 163+'Bavarian':'bar',
 164+'Burmese':'my',
 165+'Manx':'gv',
 166+'Divehi':'dv',
 167+'Norman':'nrm',
 168+'Pangasinan':'pag',
 169+'Romansh':'rm',
 170+'Banyumasan':'map-bms',
 171+'Zazaki':'diq',
 172+'Sorani':'ckb',
 173+'Northern Sami':'se',
 174+'Mazandarani':'mzn',
 175+'Wu':'wuu',
 176+'Uyghur':'ug',
 177+'Friulian':'fur',
 178+'Ligurian':'lij',
 179+'Maltese':'mt',
 180+'Bihari':'bh',
 181+'Novial':'nov',
 182+'Malagasy':'mg',
 183+'Kashubian':'csb',
 184+'Ilokano':'ilo',
 185+'Sardinian':'sc',
 186+'Classical Chinese':'zh-classical',
 187+'Khmer':'km',
 188+'Ladino':'lad',
 189+'Pali':'pi',
 190+'Anglo-Saxon':'ang',
 191+'Zamboanga Chavacano':'cbk-zam',
 192+'Tibetan':'bo',
 193+'Fiji Hindi':'hif',
 194+'Franco-Provençal':'frp',
 195+'Arpitan':'frp',
 196+'Hakka':'hak',
 197+'Cornish':'kw',
 198+'Punjabi':'pa',
 199+'Pashto':'ps',
 200+'Kalmyk':'xal',
 201+'Silesian':'szl',
 202+'Pennsylvania German':'pdc',
 203+'Hawaiian':'haw',
 204+'Saterland Frisian':'stq',
 205+'Interlingue':'ie',
 206+'Navajo':'nv',
 207+'Fijian':'fj',
 208+'Crimean Tatar':'crh',
 209+'Komi':'kv',
 210+'Tongan':'to',
 211+'Acehnese':'ace',
 212+'Somali':'so',
 213+'Erzya':'myv',
 214+'Guarani':'gn',
 215+'Karachay-Balkar':'krc',
 216+'Extremaduran':'ext',
 217+'Lingala':'ln',
 218+'Kirghiz':'ky',
 219+'Meadow Mari':'mhr',
 220+'Assyrian Neo-Aramaic':'arc',
 221+'Emilian-Romagnol':'eml',
 222+'Lojban':'jbo',
 223+'Picard':'pcd',
 224+'Aymara':'ay',
 225+'Wolof':'wo',
 226+'Tumbuka':'tum',
 227+'Kabyle':'kab',
 228+'Bashkir':'ba',
 229+'North Frisian':'frr',
 230+'Tahitian':'ty',
 231+'Tok Pisin':'tpi',
 232+'Papiamentu':'pap',
 233+'Zealandic':'zea',
 234+'Sranan':'srn',
 235+'Greenlandic':'kl',
 236+'Udmurt':'udm',
 237+'Chechen':'ce',
 238+'Igbo':'ig',
 239+'Komi-Permyak':'koi',
 240+'Oriya':'or',
 241+'Lower Sorbian':'dsb',
 242+'Kongo':'kg',
 243+'Lao':'lo',
 244+'Abkhazian':'ab',
 245+'Moksha':'mdf',
 246+'Romani':'rmy',
 247+'Hill Mari':'mrj',
 248+'Banjar':'bjn',
 249+'Old Church Slavonic':'cu',
 250+'Mirandese':'mwl',
 251+'Karakalpak':'kaa',
 252+'Samoan':'sm',
 253+'Moldovan':'mo',
 254+'Tetum':'tet',
 255+'Avar':'av',
 256+'Kashmiri':'ks',
 257+'Gothic':'got',
 258+'Sindhi':'sd',
 259+'Bambara':'bm',
 260+'Nauruan':'na',
 261+'Norfolk':'pih',
 262+'Pontic':'pnt',
 263+'Inuktitut':'iu',
 264+'Inupiak':'ik',
 265+'Bislama':'bi',
 266+'Cherokee':'chr',
 267+'Assamese':'as',
 268+'Min Dong':'cdo',
 269+'Ewe':'ee',
 270+'Swati':'ss',
 271+'Oromo':'om',
 272+'Zhuang':'za',
 273+'Zulu':'zu',
 274+'Tigrinya':'ti',
 275+'Venda':'ve',
 276+'Tsonga':'ts',
 277+'Hausa':'ha',
 278+'Dzongkha':'dz',
 279+'Sango':'sg',
 280+'Chamorro':'ch',
 281+'Cree':'cr',
 282+'Xhosa':'xh',
 283+'Akan':'ak',
 284+'Sesotho':'st',
 285+'Kinyarwanda':'rw',
 286+'Tswana':'tn',
 287+'Kikuyu':'ki',
 288+'Buryat':'bxr',
 289+'Buginese':'bug',
 290+'Chichewa':'ny',
 291+'Lak':'lbe',
 292+'Twi':'tw',
 293+'Shona':'sn',
 294+'Kirundi':'rn',
 295+'Fula':'ff',
 296+'Cheyenne':'chy',
 297+'Luganda':'lg',
 298+'Ndonga':'ng',
 299+'Sichuan Yi':'ii',
 300+'Choctaw':'cho',
 301+'Marshallese':'mh',
 302+'Afar':'aa',
 303+'Kuanyama':'kj',
 304+'Hiri Motu':'ho',
 305+'Muscogee':'mus',
 306+'Kanuri':'kr',
 307+'Herero':'hz',
 308+'English':'en',
 309+'Deutsch':'de',
 310+'Français':'fr',
 311+'Italiano':'it',
 312+'Polski':'pl',
 313+'日本語':'ja',
 314+'Español':'es',
 315+'Nederlands':'nl',
 316+'Português':'pt',
 317+'Русский':'ru',
 318+'Svenska':'sv',
 319+'中文':'zh',
 320+'Català':'ca',
 321+'Norsk':'no',
 322+'Bokmål':'no',
 323+'Suomi':'fi',
 324+'Українська':'uk',
 325+'Magyar':'hu',
 326+'Čeština':'cs',
 327+'Română':'ro',
 328+'Türkçe':'tr',
 329+'한국어':'ko',
 330+'Tiếng Việt':'vi',
 331+'Dansk':'da',
 332+'العربية':'ar',
 333+'Esperanto':'eo',
 334+'Српски':'sr',
 335+'Srpski':'sr',
 336+'Bahasa Indonesia':'id',
 337+'Lietuvių':'lt',
 338+'Volapük':'vo',
 339+'Slovenčina':'sk',
 340+'עברית':'he',
 341+'Български':'bg',
 342+'فارسی':'fa',
 343+'Slovenščina':'sl',
 344+'Winaray':'war',
 345+'Hrvatski':'hr',
 346+'Eesti':'et',
 347+'Bahasa Melayu':'ms',
 348+'नेपाल भाषा':'new',
 349+'Simple English':'simple',
 350+'Galego':'gl',
 351+'ไทย':'th',
 352+'Armãneashce':'roa-rup',
 353+'Nynorsk':'nn',
 354+'Euskara':'eu',
 355+'हिन्दी':'hi',
 356+'Ελληνικά':'el',
 357+'Krèyol ayisyen':'ht',
 358+'Latina':'la',
 359+'తెలుగు':'te',
 360+'ქართული':'ka',
 361+'Sinugboanong Binisaya':'ceb',
 362+'Македонски':'mk',
 363+'Azərbaycan':'az',
 364+'Tagalog':'tl',
 365+'Brezhoneg':'br',
 366+'Srpskohrvatski':'sh',
 367+'Српскохрватски':'sh',
 368+'मराठी':'mr',
 369+'Lëtzebuergesch':'lb',
 370+'Basa Jawa':'jv',
 371+'Latviešu':'lv',
 372+'Bosanski':'bs',
 373+'Íslenska':'is',
 374+'Cymraeg':'cy',
 375+'Беларуская':'be-x-old',
 376+'тарашкевіца':'be-x-old',
 377+'Piemontèis':'pms',
 378+'Shqip':'sq',
 379+'தமிழ்':'ta',
 380+'ইমার ঠার':'bpy',
 381+'বিষ্ণুপ্রিয়া মণিপুরী':'bpy',
 382+'Беларуская':'be',
 383+'Aragonés':'an',
 384+'Occitan':'oc',
 385+'বাংলা':'bn',
 386+'Kiswahili':'sw',
 387+'Ido':'io',
 388+'Ripoarisch':'ksh',
 389+'Lumbaart':'lmo',
 390+'Frysk':'fy',
 391+'ગુજરાતી':'gu',
 392+'Plattdüütsch':'nds',
 393+'Afrikaans':'af',
 394+'Sicilianu':'scn',
 395+'Runa Simi':'qu',
 396+'Kurdî':'ku',
 397+'كوردی':'ku',
 398+'اردو':'ur',
 399+'Basa Sunda':'su',
 400+'മലയാളം':'ml',
 401+'粵語':'zh-yue',
 402+'Asturianu':'ast',
 403+'Nnapulitano':'nap',
 404+'Žemaitėška':'bat-smg',
 405+'Walon':'wa',
 406+'Чăваш':'cv',
 407+'Gaeilge':'ga',
 408+'Հայերեն':'hy',
 409+'Yorùbá':'yo',
 410+'ಕನ್ನಡ':'kn',
 411+'Тоҷикӣ':'tg',
 412+'Tarandíne':'roa-tara',
 413+'Vèneto':'vec',
 414+'شاہ مکھی پنجابی':'pnb',
 415+'Shāhmukhī Pañjābī':'pnb',
 416+'नेपाली':'ne',
 417+'Gàidhlig':'gd',
 418+'ייִדיש':'yi',
 419+'Bân-lâm-gú':'zh-min-nan',
 420+'O‘zbek':'uz',
 421+'Tatarça':'tt',
 422+'Татарча':'tt',
 423+'Kapampangan':'pam',
 424+'Иронау':'os',
 425+'Саха тыла':'sah',
 426+'Saxa Tyla':'sah',
 427+'Alemannisch':'als',
 428+'Māori':'mi',
 429+'مصرى':'arz',
 430+'Maṣrī':'arz',
 431+'Қазақша':'kk',
 432+'Nāhuatl':'nah',
 433+'Limburgs':'li',
 434+'Hornjoserbsce':'hsb',
 435+'گیلکی':'glk',
 436+'Corsu':'co',
 437+'贛語':'gan',
 438+'አማርኛ':'am',
 439+'Монгол':'mn',
 440+'Interlingua':'ia',
 441+'Bikol':'bcl',
 442+'Võro':'fiu-vro',
 443+'Nedersaksisch':'nds-nl',
 444+'Føroyskt':'fo',
 445+'تركمن ':'tk',
 446+'Туркмен':'tk',
 447+'Scots':'sco',
 448+'West-Vlams':'vls',
 449+'සිංහල':'si',
 450+'संस्कृतम्':'sa',
 451+'Boarisch':'bar',
 452+'မ္ရန္‌မာစာ':'my', #Needs fix
 453+'Gaelg':'gv',
 454+'ދިވެހިބަސް':'dv',
 455+'Nouormand':'nrm',
 456+'Normaund':'nrm',
 457+'Pangasinan':'pag',
 458+'Rumantsch':'rm',
 459+'Basa Banyumasan':'map-bms',
 460+'Zazaki':'diq',
 461+'Soranî':'ckb',
 462+'کوردی':'ckb',
 463+'Sámegiella':'se',
 464+'مَزِروني':'mzn',
 465+'吴语':'wuu',
 466+'Oyghurque':'ug',
 467+'Furlan':'fur',
 468+'Líguru':'lij',
 469+'Malti':'mt',
 470+'भोजपुरी':'bh',
 471+'Novial':'nov',
 472+'Malagasy':'mg',
 473+'Kaszëbsczi':'csb',
 474+'Ilokano':'ilo',
 475+'Sardu':'sc',
 476+'古文':'zh-classical',
 477+'文言文':'zh-classical',
 478+'ភាសាខ្មែរ':'km',
 479+'Dzhudezmo':'lad',
 480+'पाऴि':'pi',
 481+'Englisc':'ang',
 482+'Chavacano de Zamboanga':'cbk-zam',
 483+'བོད་སྐད':'bo',
 484+'Fiji Hindi':'hif',
 485+'Arpitan':'frp',
 486+'Hak-kâ-fa':'hak',
 487+'客家話':'hak',
 488+'Kernewek':'kw',
 489+'Karnuack':'kw',
 490+'ਪੰਜਾਬੀ':'pa',
 491+'پښتو':'ps',
 492+'Хальмг':'xal',
 493+'Ślůnski':'szl',
 494+'Deitsch':'pdc',
 495+'Hawai`i':'haw',
 496+'Seeltersk':'stq',
 497+'Interlingue':'ie',
 498+'Diné bizaad':'nv',
 499+'Na Vosa Vakaviti':'fj',
 500+'Qırımtatarca':'crh',
 501+'Коми':'kv',
 502+'faka Tonga':'to',
 503+'Bahsa Acèh':'ace',
 504+'Soomaaliga':'so',
 505+'Эрзянь':'myv',
 506+'Erzjanj Kelj':'myv',
 507+"Avañe'ẽ":'gn',
 508+'Къарачай-Малкъар':'krc',
 509+'Qarachay-Malqar':'krc',
 510+'Estremeñu':'ext',
 511+'Lingala':'ln',
 512+'Кыргызча':'ky',
 513+'Олык Марий':'mhr',
 514+'Olyk Marij':'mhr',
 515+'ܐܪܡܝܐ':'arc',
 516+'Emiliàn e rumagnòl':'eml',
 517+'Lojban':'jbo',
 518+'Picard':'pcd',
 519+'Aymar':'ay',
 520+'Wolof':'wo',
 521+'chiTumbuka':'tum',
 522+'Taqbaylit':'kab',
 523+'Башҡорт':'ba',
 524+'Frasch':'frr',
 525+'Reo Mā`ohi':'ty',
 526+'Tok Pisin':'tpi',
 527+'Papiamentu':'pap',
 528+'Zeêuws':'zea',
 529+'Sranantongo':'srn',
 530+'Kalaallisut':'kl',
 531+'Удмурт кыл':'udm',
 532+'Нохчийн':'ce',
 533+'Igbo':'ig',
 534+'Перем Коми':'koi',
 535+'Perem Komi':'koi',
 536+'ଓଡ଼ିଆ':'or',
 537+'Dolnoserbski':'dsb',
 538+'KiKongo':'kg',
 539+'ລາວ':'lo',
 540+'Аҧсуа':'ab',
 541+'Мокшень':'mdf',
 542+'Mokshanj Kälj':'mdf',
 543+'romani - रोमानी':'rmy',
 544+'Кырык Мары':'mrj',
 545+'Kyryk Mary':'mrj',
 546+'Bahasa Banjar':'bjn',
 547+'Словѣньскъ':'cu',
 548+'Páigina Percipal':'mwl',
 549+'Qaraqalpaqsha':'kaa',
 550+'Gagana Samoa':'sm',
 551+'Молдовеняскэ':'mo',
 552+'Tetun':'tet',
 553+'Авар':'av',
 554+'कश्मीरी':'ks',
 555+'كشميري':'ks',
 556+'𐌲𐌿𐍄𐌹𐍃𐌺':'got', #Needs fix
 557+'سنڌي، سندھی ، सिन्ध':'sd',
 558+'Bamanankan':'bm',
 559+'dorerin Naoero':'na',
 560+'Norfuk':'pih',
 561+'Ποντιακά':'pnt',
 562+'ᐃᓄᒃᑎᑐᑦ':'iu',
 563+'Iñupiak':'ik',
 564+'Bislama':'bi',
 565+'ᏣᎳᎩ':'chr',
 566+'অসমীয়া':'as',
 567+'Mìng-dĕ̤ng-ngṳ̄':'cdo',
 568+'Eʋegbe':'ee',
 569+'SiSwati':'ss',
 570+'Oromoo':'om',
 571+'Cuengh':'za',
 572+'isiZulu':'zu',
 573+'ትግርኛ':'ti',
 574+'Tshivenda':'ve',
 575+'Xitsonga':'ts',
 576+'هَوُسَ':'ha',
 577+'ཇོང་ཁ':'dz',
 578+'Sängö':'sg',
 579+'Chamoru':'ch',
 580+'Nehiyaw':'cr',
 581+'isiXhosa':'xh',
 582+'Akana':'ak',
 583+'Sesotho':'st',
 584+'Ikinyarwanda':'rw',
 585+'Setswana':'tn',
 586+'Gĩkũyũ':'ki',
 587+'Буряад':'bxr',
 588+'Basa Ugi':'bug',
 589+'Chi-Chewa':'ny',
 590+'Лакку':'lbe',
 591+'Twi':'tw',
 592+'chiShona':'sn',
 593+'Kirundi':'rn',
 594+'Fulfulde':'ff',
 595+'Tsetsêhestâhese':'chy',
 596+'Luganda':'lg',
 597+'Oshiwambo':'ng',
 598+'ꆇꉙ':'ii',
 599+'Choctaw':'cho',
 600+'Ebon':'mh',
 601+'Afar':'aa',
 602+'Kuanyama':'kj',
 603+'Hiri Motu':'ho',
 604+'Muskogee':'mus',
 605+'Kanuri':'kr',
 606+'Otsiherero':'hz',
 607+}
\ No newline at end of file
Property changes on: trunk/tools/editor_trends/languages.py
___________________________________________________________________
Added: svn:eol-style
1608 + native
Added: svn:mime-type
2609 + text/plain

Follow-up revisions

RevisionCommit summaryAuthorDate
r75211Follow up to r75190, added alternate symbolsjeroendedauw18:51, 22 October 2010

Status & tagging log