מכל מלמדײ השכלתי (duchifat) wrote,
מכל מלמדײ השכלתי
duchifat

китайские иероглифы как сеть

Любопытная статья - китайские иероглифы как сеть
Efficient learning strategy of Chinese characters based on network approach
https://arxiv.org/abs/1303.1599
https://www.ncbi.nlm.nih.gov/pmc/articles/PMC3749196/
Можно только удивляться, но это Шломо Халвин из Бар-Илана. Он уже покрыл и эту тему. Ну конечно там распределение Ципфа, а дальше я еще не прочитал.


Figure 2 Full map of the Chinese character network.
For a better visual demonstration, we plot here the minimum spanning tree of the whole network which is shown in blue while other links are presented in grey as a background.


Figure 3 Topological properties of Chinese character network.
(A) Hierarchical distribution: number of characters at each level. The number of characters in each level that have no offspings is shown in brown. (B) Node-offspring distribution: Zipf plot, where characters are ranked according to their number of offsprings. The number of offsprings of a character is plotted against the rank of the character.

PS. Вот еще по теме:
X Yan, P Minnhagen Maximum Entropy, Word-Frequency, Chinese Characters, and Multiple Meanings, PlosONE. 2015
https://journals.plos.org/plosone/article?id=10.1371/journal.pone.0125592
The 'Letter' Distribution in the Chinese Language
https://arxiv.org/abs/2006.01210
Они там разбирают, что в китайской системе письма похоже (статистически) на буквы - иероглифы, штрихи или радикалы - и вытасняют, что радикалы.
"We discuss the distribution for letter frequency of 10 alphabetical writing languages and find the letter distributions to be very consistent. Additionally, we conducted a statistical analysis involves the corpora of Chinese literature throughout different historical periods from the Tang Dynasty to the present. We found the Chinese constructive parts of having similar statistics to characters with letters in other languages. The data could be well-fitted by the same equations, which is significant
evidence. As yet, there is no standard way to decompose the Chinese characters into more basic components. Different scholars have different ways of decomposing them."
Tags: science
Subscribe

  • (no subject)

    Любопытная статья про то, что скорость звука в твердых материалах ограничена величиной 36 км / с, точнее, V/c= alpha (m_e/2m_p)^1/2, где alpha -…

  • (no subject)

    Нет, я не только про трибоинформатику думаю (хотя и пытаюсь для себя мысленно разобраться со всяческими новомодными вычислительными концепциями,…

  • (no subject)

    Каким образом искусственная нейронная сеть со всего одним промежуточным слоем с 15 нейронами может распознавать (в 95% случаев) неряшливо написанные…

  • Post a new comment

    Error

    Comments allowed for friends only

    Anonymous comments are disabled in this journal

    default userpic

    Your reply will be screened

    Your IP address will be recorded 

  • 0 comments