Языки в Интернете — Википедия
Вопрос о популярности тех или иных языков в современном Интернете остаётся дискуссионным и часто зависит от заданных параметров. Статистический подсчёт осложняется также растущим многоязычием сайтов и даже страниц. Данная cтатья освещает распространение языков в сети Интернет, их процентное соотношение по веб-сайтам, по пользователям — носителям языков, и т. п. Поскольку компьютерная сеть, а затем и Интернет в современном его виде появились в США, где самым распространённым языком в масштабах страны, а также единственным официальным на уровне большинства штатов является английский, то первое время именно английский был преобладающим, если не единственным языком Интернет-сайтов, а также большинства пользователей. Однако после выхода на мировую арену доля английского языка на сайтах начала стремительно сокращаться в связи с тем, что в мире имеется несколько языков, число носителей которых либо превышает число англоязычных (испанский, хинди), либо растёт более быстрыми темпами (арабского, турецкого, тайского). Кроме этого, активное использование Интернета на правительственных сайтах всех уровней выводит вперёд языки крупнейших по площади государств мира (Россия, КНР, Бразилия). В пятерку самых популярных языков Интернета в настоящее время входят английский, русский, занимающий 2-ое место с 2013 года, японский, немецкий и испанский языки. Примечательно и то, что из самых популярных языков только русский, и, в гораздо меньшей степени, испанский являются одновременно и одними из самых быстрорастущих по числу пользователей-носителей языка, занимая соответственно 2-е и 5-e местa по скорости прироста сайтов на ниx. Рекордсменом скорости роста сайтов является арабский язык, хотя общая доля сайтов на нём по-прежнему невелика (0,7 %). Далее самые высокие скорости прироста по числу пользователей демонстрируют русский, китайский, португальский и испанский языки.
Чуть более половины веб-сайтов и веб-страниц в Интернете по-прежнему используют английский как основной язык, однако его доля имеет тенденцию к постепенному сокращению за счёт более быстрого роста сегментов Интернета на других языках. По результатам исследования, проведённого W3Techs, доля английского языка c апреля 2011 года по ноябрь 2017 на всех сайтax мира сократилась с 57,6 % до 51,2 %[1]. Другими языками, которые используются хотя бы на 2,0 % сайтов, являются русский, немецкий, японский, испанский, китайский, французский, итальянский, португальский. По данным исследования W3Techs, в марте 2013 русский язык вышел на 2-e место по использованию в Интернете
Ниже приведена подробная таблица динамики языков, использующихся на веб-сайтах 2011—2019 гг.[4][5].
Язык | 21.07.2019,% | 1.01.2019,% | 2011,% | |
---|---|---|---|---|
английский | 54,0 | 54,0 | 57,6[6] | |
русский | 6,1 | 6,0 | 4,8 | |
немецкий | 5,7 | 6.0 | 4,7 | |
испанский | 5,0 | 4.9 | 6,5 | |
французский | 3,9 | 4.0 | 4,6 | |
японский | 3,5 | 3.4 | 3,9 | |
португальский | 2,9 | 2.9 | 2,0 | |
итальянский | 2,4 | 2,3 | 2,1 | |
персидский | 2,0 | 2,0 | 4,5 | |
польский | 1,7 | 1.7 | 1,4 | |
китайский | 1,6 | 1,7 | 1,1 | |
турецкий | 1,3 | 1.2 | ||
голландский | 1,1 | 1,2 | 1,1 | |
чешский | 1,0 | 1,0 | ||
корейский | 1,0 | 0,9 | ||
вьетнамский | 0,7 | 0,6 | ||
арабский | 0,6 | 0,6 | ||
греческий | 0,6 | 0,5 | ||
венгерский | 0,5 | 0,5 | ||
шведский | 0,5 | 0,5 | ||
румынский | 0,5 | 0,4 | ||
словацкий | 0,4 | 0,4 | ||
индонезийский | 0,4 | 0,3 | ||
датский | 0,3 | 0,3 | ||
тайский | 0,3 | 0,3 | ||
финский | 0,3 | 0,3 | ||
болгарский | 0,2 | 0,2 | ||
украинский | 0,2 | 0,2 | ||
иврит | 0,2 | 0,2 | ||
норвежский (букмол) | 0,2 | |||
хорватский | 0,2 | 0,2 | ||
сербский | 0,1 | 0,1 | ||
литовский | 0,1 | 0,1 | ||
словенский | 0,1 | 0,1 | ||
норвежский (нюнорск) | 0,1 | 0,1 | ||
каталонский | 0,1 | 0,1 | ||
латышский | 0,1 | 0,1 | ||
хинди | 0,1 | 0,1 | ||
эстонский | 0,1 | 0,1 | ||
азербайджанский | <0.1% | 0,1 |
Все другие языки используются на менее чем 0,1 % сайтов. Статистический подсчёт, однако, осложняется также растущим многоязычием сайтов и даже страниц. Проникновение Интернета, уровень образования, степень реальной урбанизации и постиндустриализации тех или иных сообществ несомненно вносят свои коррективы в динамику использования тех или иных языков в Интернете, вызывая сильные диспропорции. К примеру, сайтов на русском (6,7 %) заметно больше, чем на испанском (5,1 %), хотя доля испаноязычных в мире как минимум вдвое больше, чем русскоязычных. А доля сайтов на китайском языке (2,0 %) в 2017 году была практически идентичной их доле на польском (1,7 %), хотя синоязычных в мире почти в 40 раз больше, чем поляков. Из-за традиционного предпочтения английского языка в Британской Индии, хинди (второй по численности носителей родной язык в мире после китайского) по-прежнему очень слабо используется в Интернете и каких-либо сдвигов к продвижению второго по количеству носителей языка в мире технологий пока не наблюдается. При создании интернет-содержания большим спросом по-прежнему практически не пользуются такие весьма известные или многочисленные современные государственные языки как албанский, армянский, африкаанс, тагалог, казахский, узбекский, бенгали, монгольский, урду, суахили, таджикский, малайский и др.
Основными пользователями Интернета по состоянию на 2011 год являлись носители английского и китайского языков (26,8 % и 24,2 % от всех пользователей, соответственно). По количеству носителей русский язык занимал девятое место, и русскоязычные составляли 3 % от всех пользователей. Oднако русскоязычные пользователи сумели создать обширный Рунет, охватывающий более 6,5 % мировых сайтов. Отчасти это объясняется тем, что Россия является крупнейшим государством мира, имеющим большое количество правительственных сайтов различного уровня на русском языке.
За последние десять лет наибольший прирост по числу пользователей имели арабский (2501,2 %), русский (1825,8 %), китайский (1478,7 %), португальский (990,1 %), испанский (807,4 %).
Ниже приведена подробная таблица десятка самых распространённых языков в Интернете по числу носителей по состоянию на 2011 год[8].
Позиция | Язык | Пользователей Интернета | % от всех |
---|---|---|---|
1 | английский | 565 004 126 | 26,8 |
2 | китайский | 509 965 013 | 24,2 |
3 | испанский | 164 968 742 | 7,8 |
4 | японский | 99 182 000 | 4,7 |
5 | португальский | 82 586 600 | 3,9 |
6 | немецкий | 75 422 674 | 3,6 |
7 | арабский | 65 365 400 | 3,3 |
8 | французский | 59 779 525 | 3,0 |
9 | русский | 59 700 000 | 3,0 |
10 | корейский | 39 440 000 | 2,0 |
Первый десяток | 1 615 957 333 | 82,2 | |
350 557 483 | 17,8 | ||
Все языки | 2 099 926 965 | 100 |
Ниже приведена подробная таблица десятка самых распространённых языков в Интернете по числу носителей по состоянию на 2019 год [9]
Позиция | Язык | Пользователей Интернета | % от всех |
---|---|---|---|
1 | английский | 1,105,919,154 | 25,2 |
2 | китайский | 863,230,794 | 19,3 |
3 | испанский | 344,448,932 | 7,9 |
4 | арабский | 226,595,470 | 5,2 |
5 | португальский | 171,583,004 | 3,9 |
6 | малайский (включая индонезийский) | 169,685,798 | 3,9 |
7 | французский | 144,695,288 | 3,3 |
8 | японский | 118,626,672 | 2,7 |
9 | русский | 109,552,842 | 2,5 |
10 | немецкий | 92,304,792 | 2,1 |
Первый десяток | 3,346,642,747 | 76,3 | |
Остальные языки | 1,039,842,794 | 23,7 | |
Все языки | 4,386,485,541 | 100 |
Для интернета существует только 4% мировых языков. Остальные 96% мертвы
Для многих будет открытием, что жители Ближнего Востока предпочитают пользоваться для электронной переписки в интернете латинским алфавитом: сами слова они пишут по-арабски, но латинскими буквами. Более того, например, в Египте, многие вывески на магазинах тоже написаны по-арабски, но латиницей. Означает ли это, что древней арабской письменности пришёл конец?
Судя по новейшим исследованиям, арабскому языку и его традиционной письменности как раз ничего не угрожает – в отличие от нескольких тысяч других языков, которые просто не переживут цифровой век. Уже сегодня, по оценкам специалистов, целых 96% из более чем семи тысяч «живых» языков никак не используются в мобильных телефонах, планшетах и персональных компьютерах. Для Всемирной сети их уже не существует, так что интернет может стать для подавляющего большинства языков мира чем-то вроде глобальной катастрофы, которая стёрла с лица Земли всех динозавров.
Постепенные изменения, происходящие в тех или иных областях человеческой жизни, обычно описываются термином «эволюция», принятым в биологии. Однако когда учёные обсуждают эволюцию языков, терминология становится ещё более биологической: языки конкурируют за ареалы, порождают далёких родственников и умирают совсем как живые организмы.
В рамках научной деятельности ЮНЕСКО ведётся целый Атлас языков мира, находящихся под угрозой исчезновения. На момент написания статьи к этой категории отнесён 2 471 язык, с разной степенью уязвимости, причём используемая там классификация чрезвычайно близка к классификации вымирающих биологических видов. Учёные оценивают степень опасности по различным критериям, в том числе по числу носителей языка, для которых он родной. В октябре 2013 года была опубликована любопытная научная работа «Цифровая смерть языков», в которой известный венгерский математик и лингвист Андраш Корнай исследует, какие из мировых языков находятся под угрозой вымирания в интернете и в электронных устройствах.
По мнению Корная, об опасности, грозящей языкам в реальной жизни, свидетельствуют три признака. Во-первых, это утрата функциональности, в то время как какие-то другие языки вытесняют его из обихода в целых областях – например, в повседневном электронном общении, в электронной коммерции или официальном бизнесе. «Если этого нет в интернете, этого не существует».
Во-вторых, это потеря престижа, особенно у молодого поколения. И, наконец, утрата языковой компетентности, которая выражается в появлении поколения «полуносителей», которые всё ещё понимают старшее поколение, но сами выработали для себя серьёзно упрощённую версию грамматики.
Те же правила применимы и к интернету и цифровым устройствам, но если учёные давно привыкли наблюдать за упадком языков в реальном мире, то здесь возникает вопрос, возможно ли обратить процесс и сделать умирающие языки жизнеспособными в цифровом мире. Возможно ли полноценное онлайновое общение на таком языке и можно ли будет воспользоваться всем многообразием новых технологий с его помощью?
Задачей Корная было определить, как каждый из 7 776 мировых языков представлен в интернете. Во внимание принимались пять взаимосвязанных факторов: размер и демографический состав языкового сообщества, престиж языка, его идентификационная функция; уровень поддержки в программном обеспечении и представленность в Википедии.
Для этого он использовал различные методики. В частности, для определения степени представленности разных языков в общедоступных онлайновых текстах он измерял объём и число статей в Википедии на каждом из языков. Чтобы установить уровень поддержки языка в программном обеспечении, изучались как локализации интерфейса программ и системы проверки орфографии, так и просто его наличие в стандарте Unicode и других базах данных, позволяющих компьютерным устройствам автоматически опознавать разные языки.
Присутствие языка в Википедии стало одним из важнейших индикаторов его способности выжить в цифровой век. Поскольку успешность языка в цифровом пространстве означает его активное использование, было необходимо определить по меньшей мере одно популярное онлайновое сообщество, основанное на языке как основном средстве коммуникации. Таким сообществом могли быть доски объявлений, рассылки, группы Yahoo или Google, но, по мнению Корная, Википедия всегда становится одним из первых активных цифровых языковых сообществ, которое можно рассматривать в качестве раннего индикатора того факта, что какой-то язык действительно преодолевает «цифровой барьер». Причина в том, что дети, едва начав пользоваться компьютером не только для игр, практически сразу знакомятся с Википедией, предлагающей чрезвычайно комфортную среду для единомышленников. Онлайновая энциклопедия, составляемая пользователями, не только позволяет суммировать знания человечества, но и способна стать мощным инструментом продвижения языка и культуры в цифровом мире.
Чтобы язык получил полномочное представительство в интернете, ему жизненно необходима своя Википедия. Это подтверждает тот факт, что в настоящее время на стадии «инкубатора» находятся 533 языковых заявки, что более чем вдвое превышает число существующих Википедий. Желание обзавестить полноценной работающей Википедией настолько велико, что нередко приводит к манипуляциям с системой ранжирования, которая традиционно оценивает локализованные версии исключительно по числу входящих в них статей. Вопиющий пример таких манипуляций – это неизменно занимающая места в первых десятках энциклопедия на искусственном языке волапюк, который фактически не используется сегодня никем, кроме трёх десятков энтузиастов. Почти все её статьи написаны ботами и состоят из чрезвычайно «полезной» информации вроде «Китсеместа – деревня в Эстонии, расположена на широте 8°55′ N и долготе 26°19′ E». В настоящее время ведётся дискуссия о перемещении Википедии на волапюке обратно в инкубатор и о предотвращении появления в дальнейшем подобных псевдоэнциклопедий.
На основе полученных в ходе исследования данных все языки были поделены на пять категорий: процветающие, жизнеспособные, пограничные, наследие (онлайновое присутствие обусловлено исключительно работой учёных по их изучению) и мёртвые (вообще не присутствующие ни в онлайне, ни в цифровых устройствах).
Выводы, к которым пришёл Корнай, оказались совсем неутешительными. Только 170 языков, или всего 2% от всех существующих, можно отнести к категориям процветающих или жизнеспособных в онлайне. Ещё 140, или 1,7%, можно считать пограничными. Оставшиеся 96,3%, или свыше шести тысяч языков, – «цифровые покойники». Причём в сложившихся условиях, когда для «цифровой жизни» языка требуются огромная издательская инфраструктура и многочисленные технические средства, у этих «мертвецов» нет никакой перспективы воскрешения.
Доминирование в интернете и в электронных устройствах небольшой группы мировых языков можно расценивать по-разному: как неизбежность, как возможность объединения народов или как способ держать подальше чужаков. Но это в любом случае утрата, ведь каждый язык отражает уникальный взгляд на мир и культурные установки языкового сообщества, сформировавшиеся способы восприятия окружающего мира, его философию и образ мышления. Каждый язык – это выражение культурного наследия народа, и он остаётся таковым даже после фактического исчезновения такой культуры под влиянием других, нередко враждебных. А с исчезновением языка мы навсегда утрачиваем незаменимую часть человеческой истории, культурного богатства и знаний.
Для интернета существует только 4% мировых языков
Для многих будет открытием, что жители Ближнего Востока предпочитают пользоваться для электронной переписки в интернете латинским алфавитом: сами слова они пишут по-арабски, но латинскими буквами. Более того, например, в Египте, многие вывески на магазинах тоже написаны по-арабски, но латиницей. Означает ли это, что древней арабской письменности пришёл конец?
Судя по новейшим исследованиям, арабскому языку и его традиционной письменности как раз ничего не угрожает — в отличие от нескольких тысяч других языков, которые просто не переживут цифровой век. Уже сегодня, по оценкам специалистов, целых 96% из более чем семи тысяч «живых» языков никак не используются в мобильных телефонах, планшетах и персональных компьютерах.
Для Всемирной сети их уже не существует, так что интернет может стать для подавляющего большинства языков мира чем-то вроде глобальной катастрофы, которая стёрла с лица Земли всех динозавров.
Постепенные изменения, происходящие в тех или иных областях человеческой жизни, обычно описываются термином «эволюция», принятым в биологии. Однако когда учёные обсуждают эволюцию языков, терминология становится ещё более биологической: языки конкурируют за ареалы, порождают далёких родственников и умирают совсем как живые организмы.
В рамках научной деятельности ЮНЕСКО ведётся целый Атлас языков мира, находящихся под угрозой исчезновения. На момент написания статьи к этой категории отнесён 2 471 язык, с разной степенью уязвимости, причём используемая там классификация чрезвычайно близка к классификации вымирающих биологических видов.
Учёные оценивают степень опасности по различным критериям, в том числе по числу носителей языка, для которых он родной. В октябре 2013 года была опубликована любопытная научная работа «Цифровая смерть языков», в которой известный венгерский математик и лингвист Андраш Корнай исследует, какие из мировых языков находятся под угрозой вымирания в интернете и в электронных устройствах.
По мнению Корная, об опасности, грозящей языкам в реальной жизни, свидетельствуют три признака. Во-первых, это утрата функциональности, в то время как какие-то другие языки вытесняют его из обихода в целых областях — например, в повседневном электронном общении, в электронной коммерции или официальном бизнесе. «Если этого нет в интернете, этого не существует».
Во-вторых, это потеря престижа, особенно у молодого поколения. И, наконец, утрата языковой компетентности, которая выражается в появлении поколения «полуносителей», которые всё ещё понимают старшее поколение, но сами выработали для себя серьёзно упрощённую версию грамматики.
Те же правила применимы и к интернету и цифровым устройствам, но если учёные давно привыкли наблюдать за упадком языков в реальном мире, то здесь возникает вопрос, возможно ли обратить процесс и сделать умирающие языки жизнеспособными в цифровом мире. Возможно ли полноценное онлайновое общение на таком языке и можно ли будет воспользоваться всем многообразием новых технологий с его помощью?
Задачей Корная было определить, как каждый из 7 776 мировых языков представлен в интернете. Во внимание принимались пять взаимосвязанных факторов: размер и демографический состав языкового сообщества, престиж языка, его идентификационная функция; уровень поддержки в программном обеспечении и представленность в Википедии.
Для этого он использовал различные методики. В частности, для определения степени представленности разных языков в общедоступных онлайновых текстах он измерял объём и число статей в Википедии на каждом из языков. Чтобы установить уровень поддержки языка в программном обеспечении, изучались как локализации интерфейса программ и системы проверки орфографии, так и просто его наличие в стандарте Unicode и других базах данных, позволяющих компьютерным устройствам автоматически опознавать разные языки.
Присутствие языка в Википедии стало одним из важнейших индикаторов его способности выжить в цифровой век. Поскольку успешность языка в цифровом пространстве означает его активное использование, было необходимо определить по меньшей мере одно популярное онлайновое сообщество, основанное на языке как основном средстве коммуникации. Таким сообществом могли быть доски объявлений, рассылки, группы Yahoo или Google, но, по мнению Корная, Википедия всегда становится одним из первых активных цифровых языковых сообществ, которое можно рассматривать в качестве раннего индикатора того факта, что какой-то язык действительно преодолевает «цифровой барьер».
Причина в том, что дети, едва начав пользоваться компьютером не только для игр, практически сразу знакомятся с Википедией, предлагающей чрезвычайно комфортную среду для единомышленников. Онлайновая энциклопедия, составляемая пользователями, не только позволяет суммировать знания человечества, но и способна стать мощным инструментом продвижения языка и культуры в цифровом мире.
Чтобы язык получил полномочное представительство в интернете, ему жизненно необходима своя Википедия. Это подтверждает тот факт, что в настоящее время на стадии «инкубатора» находятся 533 языковых заявки, что более чем вдвое превышает число существующих Википедий. Желание обзавестить полноценной работающей Википедией настолько велико, что нередко приводит к манипуляциям ссистемой ранжирования, которая традиционно оценивает локализованные версии исключительно по числу входящих в них статей. Вопиющий пример таких манипуляций — это неизменно занимающая места в первых десятках энциклопедия на искусственном языке волапюк, который фактически не используется сегодня никем, кроме трёх десятков энтузиастов.
Почти все её статьи написаны ботами и состоят из чрезвычайно «полезной» информации вроде «Китсеместа — деревня в Эстонии, расположена на широте 8°55′ N и долготе 26°19′ E». В настоящее время ведётся дискуссия о перемещении Википедии на волапюке обратно в инкубатор и о предотвращении появления в дальнейшем подобных псевдоэнциклопедий.
На основе полученных в ходе исследования данных все языки были поделены на пять категорий: процветающие, жизнеспособные, пограничные, наследие (онлайновое присутствие обусловлено исключительно работой учёных по их изучению) и мёртвые (вообще не присутствующие ни в онлайне, ни в цифровых устройствах).
Выводы, к которым пришёл Корнай, оказались совсем неутешительными. Только 170 языков, или всего 2% от всех существующих, можно отнести к категориям процветающих или жизнеспособных в онлайне. Ещё 140, или 1,7%, можно считать пограничными. Оставшиеся 96,3%, или свыше шести тысяч языков, — «цифровые покойники». Причём в сложившихся условиях, когда для «цифровой жизни» языка требуются огромная издательская инфраструктура и многочисленные технические средства, у этих «мертвецов» нет никакой перспективы воскрешения.
На иллюстрации показано соотношение числа носителей языка к объёму страниц на этом языке в Википедии (по логарифмической шкале).
Доминирование в интернете и в электронных устройствах небольшой группы мировых языков можно расценивать по-разному: как неизбежность, как возможность объединения народов или как способ держать подальше чужаков. Но это в любом случае утрата, ведь каждый язык отражает уникальный взгляд на мир и культурные установки языкового сообщества, сформировавшиеся способы восприятия окружающего мира, его философию и образ мышления.
Каждый язык — это выражение культурного наследия народа, и он остаётся таковым даже после фактического исчезновения такой культуры под влиянием других, нередко враждебных. А с исчезновением языка мы навсегда утрачиваем незаменимую часть человеческой истории, культурного богатства и знаний.
Олег Нечай
Источник.
Ящик пандоры – Для интернета существует только 4% мировых языков
Для многих будет открытием, что жители Ближнего Востока предпочитают пользоваться для электронной переписки в интернете латинским алфавитом: сами слова они пишут по-арабски, но латинскими буквами. Более того, например, в Египте, многие вывески на магазинах тоже написаны по-арабски, но латиницей. Означает ли это, что древней арабской письменности пришёл конец?
Судя по новейшим исследованиям, арабскому языку и его традиционной письменности как раз ничего не угрожает — в отличие от нескольких тысяч других языков, которые просто не переживут цифровой век. Уже сегодня, по оценкам специалистов, целых 96% из более чем семи тысяч «живых» языков никак не используются в мобильных телефонах, планшетах и персональных компьютерах.
Для Всемирной сети их уже не существует, так что интернет может стать для подавляющего большинства языков мира чем-то вроде глобальной катастрофы, которая стёрла с лица Земли всех динозавров.
Постепенные изменения, происходящие в тех или иных областях человеческой жизни, обычно описываются термином «эволюция», принятым в биологии. Однако когда учёные обсуждают эволюцию языков, терминология становится ещё более биологической: языки конкурируют за ареалы, порождают далёких родственников и умирают совсем как живые организмы.
В рамках научной деятельности ЮНЕСКО ведётся целый Атлас языков мира, находящихся под угрозой исчезновения. На момент написания статьи к этой категории отнесён 2 471 язык, с разной степенью уязвимости, причём используемая там классификация чрезвычайно близка к классификации вымирающих биологических видов.
Учёные оценивают степень опасности по различным критериям, в том числе по числу носителей языка, для которых он родной. В октябре 2013 года была опубликована любопытная научная работа «Цифровая смерть языков», в которой известный венгерский математик и лингвист Андраш Корнай исследует, какие из мировых языков находятся под угрозой вымирания в интернете и в электронных устройствах.
По мнению Корная, об опасности, грозящей языкам в реальной жизни, свидетельствуют три признака. Во-первых, это утрата функциональности, в то время как какие-то другие языки вытесняют его из обихода в целых областях — например, в повседневном электронном общении, в электронной коммерции или официальном бизнесе. «Если этого нет в интернете, этого не существует».
Во-вторых, это потеря престижа, особенно у молодого поколения. И, наконец, утрата языковой компетентности, которая выражается в появлении поколения «полуносителей», которые всё ещё понимают старшее поколение, но сами выработали для себя серьёзно упрощённую версию грамматики.
Те же правила применимы и к интернету и цифровым устройствам, но если учёные давно привыкли наблюдать за упадком языков в реальном мире, то здесь возникает вопрос, возможно ли обратить процесс и сделать умирающие языки жизнеспособными в цифровом мире. Возможно ли полноценное онлайновое общение на таком языке и можно ли будет воспользоваться всем многообразием новых технологий с его помощью?
Задачей Корная было определить, как каждый из 7 776 мировых языков представлен в интернете. Во внимание принимались пять взаимосвязанных факторов: размер и демографический состав языкового сообщества, престиж языка, его идентификационная функция; уровень поддержки в программном обеспечении и представленность в Википедии.
Для этого он использовал различные методики. В частности, для определения степени представленности разных языков в общедоступных онлайновых текстах он измерял объём и число статей в Википедии на каждом из языков. Чтобы установить уровень поддержки языка в программном обеспечении, изучались как локализации интерфейса программ и системы проверки орфографии, так и просто его наличие в стандарте Unicode и других базах данных, позволяющих компьютерным устройствам автоматически опознавать разные языки.
Присутствие языка в Википедии стало одним из важнейших индикаторов его способности выжить в цифровой век. Поскольку успешность языка в цифровом пространстве означает его активное использование, было необходимо определить по меньшей мере одно популярное онлайновое сообщество, основанное на языке как основном средстве коммуникации. Таким сообществом могли быть доски объявлений, рассылки, группы Yahoo или Google, но, по мнению Корная, Википедия всегда становится одним из первых активных цифровых языковых сообществ, которое можно рассматривать в качестве раннего индикатора того факта, что какой-то язык действительно преодолевает «цифровой барьер».
Причина в том, что дети, едва начав пользоваться компьютером не только для игр, практически сразу знакомятся с Википедией, предлагающей чрезвычайно комфортную среду для единомышленников. Онлайновая энциклопедия, составляемая пользователями, не только позволяет суммировать знания человечества, но и способна стать мощным инструментом продвижения языка и культуры в цифровом мире.
Чтобы язык получил полномочное представительство в интернете, ему жизненно необходима своя Википедия. Это подтверждает тот факт, что в настоящее время на стадии «инкубатора» находятся 533 языковых заявки, что более чем вдвое превышает число существующих Википедий. Желание обзавестить полноценной работающей Википедией настолько велико, что нередко приводит к манипуляциям ссистемой ранжирования, которая традиционно оценивает локализованные версии исключительно по числу входящих в них статей. Вопиющий пример таких манипуляций — это неизменно занимающая места в первых десятках энциклопедия на искусственном языке волапюк, который фактически не используется сегодня никем, кроме трёх десятков энтузиастов.
Почти все её статьи написаны ботами и состоят из чрезвычайно «полезной» информации вроде «Китсеместа — деревня в Эстонии, расположена на широте 8°55′ N и долготе 26°19′ E». В настоящее время ведётся дискуссия о перемещении Википедии на волапюке обратно в инкубатор и о предотвращении появления в дальнейшем подобных псевдоэнциклопедий.
На основе полученных в ходе исследования данных все языки были поделены на пять категорий: процветающие, жизнеспособные, пограничные, наследие (онлайновое присутствие обусловлено исключительно работой учёных по их изучению) и мёртвые (вообще не присутствующие ни в онлайне, ни в цифровых устройствах).
Выводы, к которым пришёл Корнай, оказались совсем неутешительными. Только 170 языков, или всего 2% от всех существующих, можно отнести к категориям процветающих или жизнеспособных в онлайне. Ещё 140, или 1,7%, можно считать пограничными. Оставшиеся 96,3%, или свыше шести тысяч языков, — «цифровые покойники». Причём в сложившихся условиях, когда для «цифровой жизни» языка требуются огромная издательская инфраструктура и многочисленные технические средства, у этих «мертвецов» нет никакой перспективы воскрешения.
На иллюстрации показано соотношение числа носителей языка к объёму страниц на этом языке в Википедии (по логарифмической шкале).
Доминирование в интернете и в электронных устройствах небольшой группы мировых языков можно расценивать по-разному: как неизбежность, как возможность объединения народов или как способ держать подальше чужаков. Но это в любом случае утрата, ведь каждый язык отражает уникальный взгляд на мир и культурные установки языкового сообщества, сформировавшиеся способы восприятия окружающего мира, его философию и образ мышления.
Каждый язык — это выражение культурного наследия народа, и он остаётся таковым даже после фактического исчезновения такой культуры под влиянием других, нередко враждебных. А с исчезновением языка мы навсегда утрачиваем незаменимую часть человеческой истории, культурного богатства и знаний.
Олег Нечай
Источник.
Источник: ss69100.livejournal.com
Самые популярные языки Интернета
Проект W3Techs австрийской компании Q-Success занимается исследованиями Интернета, в том числе популярностью разных языков мира во всемирной сети.
Согласно исследованию, опубликованному W3Techs в начале апреля 2013 года, 14 языков имет долю более 1% по использованию на веб-сайтах. Стоит оговориться, что в исследовании W3Techs учитывались не все сайты Интернета, а лишь 1 миллион самых популярных (согласно данным проекта alexa.com).
14-е место по популярности в Интернете занимает персидский язык (фарси), он используется на 1% сайтов мировой сети и имеет тенденцию к росту, например, на октябрь 2010 его доля составляла всего 0,6%.
13-е место занимает голландский язык- 1,1%. Доля сайтов, использующих голландский язык, постепенно падает (для сравнения — 1,3% в июле 2010 года).
12-е место — арабский язык (1,2% сайтов). Доля арабского языка в Интернете постепенно падает (1,8% на июль 2010).
11-е место — турецкий язык (1,4%). Доля турецкого последние 2 года держится примерно на одном уровне.
10-е место — итальянский язык (1,5%). Доля итальянского падает (2,1% в июле 2010).
9-е место — польский язык (1,3%), который является вторым по популярности (после русского) славянским языком Интернета и его доля в мировой сети имеет устойчивую тенденцию к росту (1,2% в октябре 2010).
8-е место — португальский язык (2,3%). Доля португальского растёт (1,5% в октябре 2010).
7-е место: японский язык (4,2%). Доля японского языка в Интернете падает — в июле 2010 с 5,5% доли японский был третьим по популярности языком Интернета.
Скромное 6-е место занимает китайский язык. Несмотря на то, что китайский является родным для 17% населения Земли, доля сайтов на китайском языке составляет 4,4% и при этом последние два года доля китайского в Интернете не растёт.
5-е место занимает французский язык (4,5%). Доля французского постепенно растёт (3,4% в октябре 2010).
4-е место занимает испанский язык (4,8%). Доля испанского в мире постепенно растёт (3,9% в июле 2010).
3-е место занимает немецкий язык, на нём работают 5,6% сайтов. Однако доля немецкого в Интернете стремительно падает — в июле 2010 года 9,4% сайтов использовали немецкий и это был второй по популярности язык Интернета.
2-е место по популярности в Интернете занимает русский язык. Его доля на апрель 2013 года составляет 6% и постоянно растёт — в июле 2010 доля русского составляла лишь 3,7%. Как отмечают авторы исследования, доля русского языка составляет 79% на украинских сайтах (зона .ua), 86,9% — на белорусских (зона .by), 84% — на казахстанских (зона .kz), 79,6% — на узбекистанских (зона .uz), 75,9% — на кыргызстанских (зона .kg) и 81,8% — на таджикистанских (зона .tj).
График роста доли русского языка в Интернете за последние 12 месяцев:
Самым популярным языком Интернета вполне ожидаемо является английский, он используется на 54,7% сайтов. В январе 2011 года доля английского достигала 57,6% и с тех пор постепенно снижается.
Что касается языков стран бывшего СССР, то доля румынского и его молдавского диалекта составляет 0,4%, а литовский, латышский и украинский языки имеют по 0,1% доли Интернета.
Самые популярные языки в мире и интернет сети. Почувствуй разницу.
Самые популярные языки в мире.
Согласно Ethnologue, справочнику по языкам мира, разрабатываемому и выпускаемому организацией SIL International, самыми популярными языками являются:
1. Китайский (кто бы сомневался!!!)
Китайский язык является родным для 1 млрд 213 млн человек. Кроме того, это официальный язык сразу для нескольких государств: Китай, Тайвань, Малайзия, Сингапур.
2. Испанский (О, да он перегнал английский, не ожидал)
Помимо самой Испании на этом языке разговаривает практически вся Латинская Америка. Испанский — родной язык для 329 млн. человек.
3. Английский
Как ни странно, но английский уступил не только китайскому, но и испанскому. Хотя в последнем случае уступка невелика — 1 миллион. Таким образом, английский — родной язык для 328 млн человек. Тем более, что эта цифра часто оспаривается, так что второе место можно смело поделить между английским и испанским.
В отличие от китайского и испанского, которые распространены в основном только в одной стране или на одном континенте, на английском общаются на всех материках, или в 112 странах мира: в Европе (Великобритания, Ирландия), Северной Америке (США, Канада), Австралии, Африке (ЮАР, Нигерия, Зимбабве), Азии (Сингапур, Малайзия).
4. Арабский
Четвертое место по праву занимает арабский язык, который является родным для 221 млн. человек и официальным для 57 государств.
5. Хинди
Официальный язык Индии Фиджи занимает пятое место среди самым популярных языков мира. По последним подсчетам своим родным языком его считают 182 млн. человек.
6. Бенгали (Что? А таком первый раз слыхали! И он популярнее русского…)
Это официальный язык Бангладеш, на котором разговаривают около 181 млн человек. Кроме того, бенгали также распространен в индийском штате Западная Бенгалия.
7. Португальский
На седьмом месте рейтинга — португальский язык, официальный язык десяти государств: Португалия, Бразилия, Ангола, Мозамбик, Кабо-Верде, Гвинеи-Бисау, Сан-Томе и Принсипи Восточный Тимор и Макао. Родным этот язык является для 178 млн человек.
8. Русский (До нас очередь тоже дошла 🙂
Русский язык, самый распространенный среди славянских языков, занимает восьмую строку рейтинга. Это официальный язык не только в РФ, а также в таких странах как Белоруссия, Казахстан, Киргизия, Крым (автономная республика Украины), 7 коммун жудецов Тулча и Констанца в Румынии, штат Нью-Йорк в США (и там наши). Родным русский является для 144 млн человек.
9. Японский
Государственный язык Японии девятый в мире по популярности. Он является родным языком для 125 млн человек. И хотя официальный статус имеет только в Японии, на этом языке также разговаривают в КНДР, Южной Кореии, на Гуаме, Тайвани, даже в Перу и Австралии (серьёзно шо ли?).
10. Немецкий
Немецкий замыкает первую десятку самых популярных языков мира. Родным он является для 110 млн человек. Кроме того, статус официального немецкий имеет сразу в нескольких государствах: Германия, Австрия, Лихтенштейн, Щвейцария, Люксембург, Бельгия, ЕС, а также на локальном уровне в некоторых регионах Дании, Италии, Польши, Ватикане (в качестве административного и языка Швейцарской гвардии). (А где же французский?!)
Самые популярные языки интернет-общения
Если по числу носителей языка как родного английский занимает только третье место, пропуская вперед китайский и испанский, то в качестве языка для общения в Сети он прочно лидирует. Однако следует учитывать тот факт, что этот рейтинг отражают не только популярность языков, но и распространенность доступа в интернет в районах проживания носителей этих языков. Таким образом, согласно исследованию, проведенному агентством Word Internet Stats, самыми популярными языками интернет-общения являются:
1. Английский
На первом месте прочно утвердился английский язык. В Сети на нем общаются 478 млн человек.
2. Китайский
Второе место за государственным языком самой многонаселенной страны мира — китайским. В качестве языка общения в Сети его используют 384 млн пользователей.
3. Испанский
На испанском в Интернете говорят 137 млн человек, что поставило этот язык на третье место в рейтинге.
4. Японский
На четвертом месте находится японский язык, на котором в Сети общаются 96 млн пользователей.
5. Французский
Французский в качестве языка общения в Интернете выбирают 79 млн пользователей.
6. Португальский
73 млн пользователей, которые предпочитают в Сети общаться на португальском, помогли занять этому языку в рейтинге шестое место.
7. Немецкий
На седьмом месте — немецкий, который является языком общения в Сети для 65 млн пользователей.
8. Арабский
На арабском в Сети разговаривают 50 млн пользователей, что ставит этот язык на восьмое место в рейтинге.
9. Русский
Русский занимает девятое место, на нем в Сети общаются 45 млн человек.
10. Корейский
Замыкает первую десятку корейский язык, который в Интернете используют 37 млн человек.
10 самых популярных языков пользователей интернета
Кстати, первое место в рейтинге среди городов, где можно развлечься, занял Лас-Вегас (его игры можно найти здесь). Уже достаточно давно английский язык является бесспорным лидером. Интернет-ресурс Internet World Stats проанализировал количество англоязычных пользователей во всём интернете, как оказалось это более 464 млн. человек. В процентном соотношении эта столь внушительная цифра составляет 29,1%. (данные за 2009 год). В 2011 году это уже 565 004 126 человек (26,8%).
В списке самых известных языков Сети, китайскому языку досталось почетное 2-е место. Однако по скорости возрастания численности его носителей, он явно оставляет позади англоязычный сегмент. К примеру, с начала 2000 года по 2008 год пользователей, говорящих на китайском, возросло в 9 раз (примерно 321 млн., что соответствует 20,1%). В 2011 году эта число пользователей увеличилось до 509 965 013 человек (24,2%).
На третьем месте испанский язык. Число интернет-пользователей в 2009 году составило более 130 млн. человек (8,2%). В 2011 году это 164 968 742 пользователей (7,8% соответственно).
Четвертое место занял японский язык. В 2009 году количество интернет-юзеров насчитывало 94 млн. человек (5,9%). В 2011 году 99 182 000 пользователей (4,7%). Интересно следующее: интернетом пользуются более 73% жителей Японии, что является самым высоким показателем во всей десятке самых популярных языков Сети. Сравнивать с носителями английского языка, число пользователей составляет каких-нибудь 37,2%.
Пятое место досталось французскому языку. Число пользователей в 2009 году насчитывало 73 млн. (4,6%) от общей аудитории. Однако в 2011 году этот показатель достиг 59 779 525 человек (3,0%).
Шестым местом может похвастаться португальский язык. В 2009 году он совсем немного отстает от французского на 0,1%. За 2011 год это уже 82 586 600 человек (3,9%).
На седьмом месте немецкий язык со своим показателем более 65 млн. (4,1%). В 2011 году число зависимых в Сети увеличилось до 75 422 674 человек (3,6%).
Арабскому языку досталось 8 место. В 2009 году пользователей насчитывалось 41 млн. человек (2,6%). В 2011 году это число достигло 65 365 400 пользователей (3,3%).
Русский язык оказался на 9 месте со своими 38 млн. (2,4%) пользователей (данные за 2009 год). Однако, в 2011 году эта цифра возросла до 59 700 000 чел. (3,0%).
Последнее 10 место досталось корейскому языку. В 2009 году количество интернет-юзеров насчитывало 36,8 млн.(2,3%). В 2011 картина меняется, и это уже 39 440 000 (2,0%).
С каждым годом люди все больше узнают о преимуществах Интернета, в котором можно без проблем найти себе занятие по вкусу и пообщаться с друзьями через социальную сеть, поэтому число пользователей будет стремительно расти из года в год.
*Реклама