Μεταγνώσεις

«Ηταν οι καλύτερες μέρες, ήταν οι χειρότερες μέρες, ήταν τα χρόνια της σοφίας, ήταν τα χρόνια της άνοιας, ήταν η εποχή της πίστης, ήταν η εποχή της ολιγοπιστίας, η εποχή του Φωτός και η εποχή του Σκότους, ήταν η άνοιξη της ελπίδας και ήταν ο χειμώνας της απελπισίας, είχαμε μπρος μας τα πάντα, είχαμε μπρος μας το τίποτε, πηγαίναμε όλοι στον Παράδεισο, πηγαίναμε όλοι στο αντίθετό του»
Ch Dickens, A Tale of Two Cities

«Εσύ κι εγώ Ζόιντ, είμαστε σαν τον Μπιγκ Φουτ. Οι καιροί περνούν, εμείς ποτέ δεν αλλάζουμε…»
Τ Πύντσον, Vineland

«Οι άνθρωποι κάνουν την ίδια τους την Ιστορία, δεν την κάνουν όμως κάτω από ελεύθερες συνθήκες, που διάλεξαν μόνοι τους, μα κάτω από συνθήκες που βρέθηκαν άμεσα, που δόθηκαν και κληρονομήθηκαν από το παρελθόν.»
K Μαρξ, Η 18η Μπρυμαίρ του Λουδοβίκου Βοναπάρτη

«Αυτοί που ελέγχουν το Μικροσκοπικό, ελέγχουν τον κόσμο»
Τ Πύντσον,
Mason & Dixon

Δευτέρα, 8 Σεπτεμβρίου 2014

Διαδικτυακό Κείμενο - οι κυρίαρχοι όροι και οι κυρίαρχες λέξεις

Το δείγμα (πιστεύω αντιπροσωπευτικό) των 74 όρων και λέξεων είναι το εξής (ελληνικά και αγγλικά):



Η "ισχύς" του κάθε όρου και λέξης στο Διαδικτυακό Κείμενο (ΔΚ), αγγλικό και ελληνικό, θα μετρηθεί με ένα μείγμα διεκτών:

google index (δημοφιλία του/της όρου/λέξης)+wiki index (τάση του/της όρου/λέξης για δικτυακή λημματογράφηση)+amazon index (books) (τάση του/της όρου/λέξης για κάθε είδους δημοσιευμένης σε βιβλία "αφήγησης") (στο ελληνικό ΔΚ αντί για τον amazon index (books) χρησιμοποίησα τον biblionet index).

Τη στιγμή που δακτυλογραφώ αυτές τις γραμμές οι χρήστες του Internet παγκοσμίως είναι 2.966.715.952 (>40% του πληθυσμού του πλανήτη)  ενώ το 55% του ΔΚ είναι στην αγγλική.

Οι έλληνες χρήστες είναι 6.583.600 (το 61% του πληθυσμού της χώρας και 0.22% του πληθυσμού του πλανήτη). Το ποσοστό του ελληνικού ΔΚ μού είναι άγνωστο.

Τα αποτελέσματα που ακολουθούν σε 3 15άδες+1 14άδα  δίνονται με βάση την στατιστική επεξεργασία του αθροίσματος των παραπάνω δεικτών και έχουν ως εξής:

Τοπ 1-15 (αγγλικό  και ελληνικό ΔΚ)






Η ταύτιση των δυο ΔΚ είναι 2/15=13%


16-30

Εδώ τα δυο ΔΚ τα πάνε κάπως καλύτερα (3/15=20%)

31-45


κι εδώ ακόμα καλύτερα (4/15=27%)

45-60



Εδώ ξαναπέφτουν (13%)


61-74



Για να κορυφωθούν στην τελευταία 14άδα στο 33% (5/15)

Έτσι με μια μέση ταύτιση των δυο ΔΚ περίπου 22%, τουλάχιστον με το μεικτό δείκτη φαίνεται να υπάρχει κάποια απόσταση μεταξύ τους

Η κατανομή των όρων/λέξεων στο δείγμα με βάση τον μεικτό δείκτη είναι πιο "δημοκρατική" για το αγγλικό ΔΚ




 ΥΓ. Τη στιγμή που δακτυλογραφώ αυτές τις γραμμές οι χρήστες του Internet παγκοσμίως είναι 2.966.744.455

(συνεχίζεται)



















Δεν υπάρχουν σχόλια:

Δημοσίευση σχολίου