Δευτέρα 9 Μαρτίου 2009

Filter X: Ένα αποτελεσματικό Ελληνικό φίλτρο κατά του πορνογραφικού υλικού στο Διαδίκτυο


Ένα νέο λογισμικό πρόγραμμα, ελληνικής πατέντας, που στηρίζεται σε μεθόδους τεχνητής νοημοσύνης και έχει τη δυνατότητα να μπλοκάρει σελίδες στο Διαδίκτυο με πορνογραφικό περιεχόμενο, πρόκειται να κυκλοφορήσει σύντομα στην παγκόσμια αγορά.

Το «έξυπνο» πρόγραμμα, με την ονομασία FilterX,
είναι το αποτέλεσμα μακρόχρονης έρευνας επιστημονικής ομάδας του Ινστιτούτου Πληροφορικής και Τηλεπικοινωνιών στο ΕΚΕΦΕ «Δημόκριτος» με ειδικότητα στην επεξεργασία φυσικής γλώσσας, την επεξεργασία εικόνων, τις τεχνολογίες Διαδικτύου κ.α. . Εγκαθίσταται σε προσωπικούς υπολογιστές ή κεντρικούς διακομιστές (servers) και μπορεί να αναγνωρίσει τις σελίδες με πορνογραφικό υλικό, πριν ακόμη αυτές εμφανιστούν στην οθόνη του χρήστη, αλλά και να εμποδίσει την πρόσβαση σε αυτές.

Το FilterX συνδυάζει αυτές τις τεχνολογίες για να επιτύχει φιλτράρισμα που βασίζεται σε ανάλυση σε πραγματικό χρόνο του περιεχομένου της ιστοσελίδας που έχει ζητηθεί από τον χρήστη. Κείμενα, εικόνες και μεταδεδομένα από το περιεχόμενο της ιστοσελίδας αξιοποιούνται για να εκτιμηθεί η πιθανότητα χαρακτηρισμού τους ως πορνογραφικό υλικό και ακολούθως να μπλοκαριστεί με ταυτόχρονη αποστολή σχετικού μηνύματος στο χρήστη.

Τα κλασικά προγράμματα φιλτραρίσματος που κυκλοφορούν στο εμπόριο χρησιμοποιούν τεχνικές βασισμένες σε προκαθορισμένες λίστες ιστοσελίδων ή απλώς λέξεων για τον εντοπισμό των πορνογραφικών ηλεκτρονικών διευθύνσεων με αποτέλεσμα να απορρίπτουν κάθε αίτημα του χρήστη για πρόσβαση σε σελίδες που περιλαμβάνονται σε αυτές τις λίστες ή περιέχουν τις αντίστοιχες λέξεις. Η αποτυχία αυτών των τεχνικών οφείλεται σε 2 λόγους: αφενός δεν μπορούν να εντοπίσουν τις νέες ιστοσελίδες που δημιουργούνται καθημερινά, ιδίως αν οι δημιουργοί τους αποφασίσουν να τις εισάγουν κάτω από φαινομενικά αθώες ηλεκτρονικές διευθύνσεις, αφετέρου, στην περίπτωση που βασίζονται σε λίστες λέξεων μπλοκάρουν σημαντικό αριθμό καθ’ όλα νόμιμων ιστοσελίδων. Αυτά τα προϊόντα είτε βασίζονται στη δημιουργία των μεγαλύτερων δυνατών λιστών είτε στη διάθεση διαρκώς νέων εκδόσεων που παρέχουν στους πελάτες με το αντίτιμο συνδρομής. Το μάταιο του όλου εγχειρήματος είναι προφανές αν σκεφτεί κανείς ότι η αναζήτηση του λήμματος *** στο Google έδινε κατά μέσο όρο 200 εκατομμύρια αποτελέσματα το καλοκαίρι του 2005.

Το FilterX συνιστά την ιδανική λύση για τους χρήστες του Διαδικτύου που θέλουν να αποφύγουν το πορνογραφικό ή άλλο ανεπιθύμητο υλικό για τους ίδιους ή τους ανηλίκους υπό την επίβλεψή τους, και μάλιστα και για ιστοσελίδες στην Ελληνική γλώσσα.
Όταν ένας χρήστης σερφάρει στο διαδίκτυο, το FilterX αναλύει σε λιγότερο από 9 χιλιοστά του δευτερολέπτου το περιεχόμενο της κάθε σελίδας, στην οποία ζητάει να πάει ο χρήστης, πριν αυτή εμφανιστεί στην οθόνη, και αποφαίνεται, με επιτυχία που ξεπερνά το 97,5%, αν αυτή είναι πορνογραφική ή όχι. Στην περίπτωση που το σύστημα αναγνωρίσει ότι η σελίδα είναι πορνογραφική, την μπλοκάρει και αντί αυτής στέλνει στο χρήστη ένα μήνυμα που εξηγεί την άρνηση της πρόσβασης.

Ο FilterX έχει ήδη επιλεγεί και χρηματοδοτηθεί από την Ευρωπαϊκή Ενωση και το πρόγραμμα λειτουργεί εδώ και χρόνια, πιλοτικά, σε σχολεία της Ευρώπης και της Ελλάδας.

Μπορεί επίσης να χρησιμοποιηθεί από επιχειρήσεις, εκπαιδευτικά ιδρύματα, Ίντερνετ καφέ ή δημόσιες βιβλιοθήκες που παρέχουν πρόσβαση στο Διαδίκτυο. Είναι δε εξαιρετικά αποτελεσματικός καθώς:

  • Μέσω της επεξεργασίας φυσικής γλώσσας και της επεξεργασίας της εικόνας αναλύει το σύνολο του περιεχομένου της ιστοσελίδας και όχι μόνο την ηλεκτρονική διεύθυνση ή τον τίτλο – είναι επομένως αποτελεσματικό ακόμη και αν δεν δηλώνεται η προέλευση του URL (είναι ανώνυμο) ή το αίτημα ξαναστέλνεται μέσω τρίτου server, κάτι που συνιστά τον πιο εύκολο τρόπο να παρακαμφθούν τα συνηθισμένα φίλτρα URL.
  • Μέσω της μηχανικής μάθησης καθορίζεται η ακριβής συμβολή της πληροφορίας που αντλείται από το κείμενο και τις εικόνες στον τελικό χαρακτηρισμό της ιστοσελίδας. Έτσι, δεν απορρίπτεται η πρόσβαση σε ιστοσελίδες μη πορνογραφικού περιεχομένου, όταν ο χρήστης αναζητά λήμματα όπως «σεξουαλικότητα» ή «βιασμός».
  • Μέσω της ανάλυσης ανά σελίδα, το σύστημα επιτυγχάνει μηδενικό υπερμπλοκάρισμα: εάν κάποιος χρήστης ανοιχτών υπηρεσιών φορτώσει πορνογραφικό ή άλλο ανεπιθύμητο υλικό στο δικό του λογαριασμό δεν πρόκειται να μπλοκαριστεί στο σύνολό του ο συγκεκριμένος ιστοχώρος
Προς το παρόν οι ενδιαφερόμενοι μπορούν προσωρινά να δοκιμάσουν το προϊόν στην ιστοσελίδα http://www.i-sieve.com

1 σχόλιο:

fvasileiou είπε...

Τελικά τα πιο ευχάριστα νέα μας τα δίνουν οι τεχνολογικές εξελίξεις...