מכל מלמדײ השכלתי (duchifat) wrote,
מכל מלמדײ השכלתי
duchifat

китайские иероглифы как сеть

Любопытная статья - китайские иероглифы как сеть
Efficient learning strategy of Chinese characters based on network approach
https://arxiv.org/abs/1303.1599
https://www.ncbi.nlm.nih.gov/pmc/articles/PMC3749196/
Можно только удивляться, но это Шломо Халвин из Бар-Илана. Он уже покрыл и эту тему. Ну конечно там распределение Ципфа, а дальше я еще не прочитал.


Figure 2 Full map of the Chinese character network.
For a better visual demonstration, we plot here the minimum spanning tree of the whole network which is shown in blue while other links are presented in grey as a background.


Figure 3 Topological properties of Chinese character network.
(A) Hierarchical distribution: number of characters at each level. The number of characters in each level that have no offspings is shown in brown. (B) Node-offspring distribution: Zipf plot, where characters are ranked according to their number of offsprings. The number of offsprings of a character is plotted against the rank of the character.

PS. Вот еще по теме:
X Yan, P Minnhagen Maximum Entropy, Word-Frequency, Chinese Characters, and Multiple Meanings, PlosONE. 2015
https://journals.plos.org/plosone/article?id=10.1371/journal.pone.0125592
The 'Letter' Distribution in the Chinese Language
https://arxiv.org/abs/2006.01210
Они там разбирают, что в китайской системе письма похоже (статистически) на буквы - иероглифы, штрихи или радикалы - и вытасняют, что радикалы.
"We discuss the distribution for letter frequency of 10 alphabetical writing languages and find the letter distributions to be very consistent. Additionally, we conducted a statistical analysis involves the corpora of Chinese literature throughout different historical periods from the Tang Dynasty to the present. We found the Chinese constructive parts of having similar statistics to characters with letters in other languages. The data could be well-fitted by the same equations, which is significant
evidence. As yet, there is no standard way to decompose the Chinese characters into more basic components. Different scholars have different ways of decomposing them."
Tags: science
Subscribe

  • питерские наблюдения

    1) В районе Пяти углов, наверно, штук 50 разных ресторанов. Среди них - израильский Бе-кицер (мне там ожидаемо не понравилось). Еще есть бар "Цыгане…

  • Pierce’s Abduction of Science: Is Anti-Intellectualism of American Universities Rooted in Pragmatism

    Пишу злобную анти-американскую статью про измерение науки деньгами. Выложу-ка сюда кусок черновика, может, у кого какие замечания? Я, в частности,…

  • (no subject)

    На мой взгляд (это я все про трактат Аркадьева думаю), бесконечность возникает не в языке (с его потенциальной возможностью бесконечной рекурсии) а…

  • Post a new comment

    Error

    Comments allowed for friends only

    Anonymous comments are disabled in this journal

    default userpic

    Your reply will be screened

    Your IP address will be recorded 

  • 0 comments