Un linguaggio è un sistema di termini indipendenti nel quale il valore di ogni termine risulta un... more Un linguaggio è un sistema di termini indipendenti nel quale il valore di ogni termine risulta unicamente dalla contemporanea presenza degli altri. 1
Con questo articolo si vuole presentare una implementazione
di un generatore di rete sintattiche ... more Con questo articolo si vuole presentare una implementazione di un generatore di rete sintattiche per la lingua inglese in ambiente R: dato un corpus viene prodotto un grafo che tiene traccia dei collegamenti fra le parole in base al posizionamento di queste nel corpus. Il grafo inoltre evidenzia le parole piu frequenti (i cosidetti "hubs") e tiene conto del PoS- tagging e quindi delle dipendenze che intercorrono tra le parole. Inne viene fatta una valutazione del diametro dei gra generati, confrontando diversi testi in lingua inglese scritti sia in prosa che in forma poetica, a cui si aggiunge un ulteriore confronto (anche se non ottimizzato) fatto fra reti sintattiche "tradizionali" e reti sintattiche semplicate in cui non si tiene conto della dependency grammar.
Several important recent advances in various sciences (particularly biology and physics) are base... more Several important recent advances in various sciences (particularly biology and physics) are based on complex network analysis, which provides tools for characterising statistical properties of networks and explaining how they may arise. This article examines the relevance of this trend for the study of human languages. We review some early efforts to build up language networks, characterise their properties, and show in which direction models are being developed to explain them. These insights are relevant, both for studying fundamental unsolved puzzles in cognitive science, in particular the origins and evolution of language, but also for recent data-driven statistical approaches to natural language.
Uploads
Papers by Mattia Trombon
di un generatore di rete sintattiche per la lingua inglese in ambiente R:
dato un corpus viene prodotto un grafo che tiene traccia dei collegamenti
fra le parole in base al posizionamento di queste nel corpus. Il grafo inoltre
evidenzia le parole piu frequenti (i cosidetti "hubs") e tiene conto del PoS-
tagging e quindi delle dipendenze che intercorrono tra le parole. Inne
viene fatta una valutazione del diametro dei gra generati, confrontando
diversi testi in lingua inglese scritti sia in prosa che in forma poetica, a
cui si aggiunge un ulteriore confronto (anche se non ottimizzato) fatto
fra reti sintattiche "tradizionali" e reti sintattiche semplicate in cui non
si tiene conto della dependency grammar.