ΕΛ/ΛΑΚ | creativecommons.gr | mycontent.ellak.gr |
freedom

Ανοικτά Δεδομένα και Σημασιολογικός Ιστός με το ΕΛ/ΛΑΚ CMS Drupal στο Α.Π.Θ., εργαστήριο Η/Υ Τμ. Μαθηματικών, νέος ιστοχώρος Σ.Θ.Ε.

Το Ελεύθερο Λογισμικό / Λογισμικό Ανοικτού Κώδικά (ΕΛ/ΛΑΚ) (http://opensource.org/osd-annotated) και τα Ανοικτά Δεδομένα (http://opendefinition.org/od/1.0/el/) σχετίζονται όσον αφορά στη θεματολογία, φιλοσοφία και στόχευση, έχουν ομοιότητες (πνευματικά δικαιώματα – αδειοδότηση, απαίτηση για ανοικτά πρότυπα, ανάπτυξη με αποκεντρωμένη διαδικτυακή συμμετοχή (crowdsourcing)), διαφορές (μέθοδοι παραγωγής, κύκλος ζωής, τεχνολογίες και εργαλεία διαχείρισης, αναπαράσταση, πατέντες, νομοθεσία, επιχειρηματικά μοντέλα ) και εμπλέκονται σε αυτά διάφοροι φορείς (ενδεικτικά Open Knowledge Foundation – OKFN, Open Data Institute – ODI, World Wide Web Consortium – W3C) και κοινότητες ανθρώπων με ποικίλες κουλτούρες και νοοτροπίες. Ο τρόπος με τον οποίο διασφαλίζεται η πρόσβαση στα Ανοικτά Δεδομένα διαβαθμίζεται με ένα σύστημα πέντε αστέρων για την κατάταξη και κλιμακωτή ανάπτυξη Συνδεδεμένων Ανοικτών Δεδομένων (Linked open Data – LOD):

1

Σήμερα το Web αποτελεί το πλέον πρόσφορο μέσο προσπέλασης λογισμικού, δεδομένων και πληροφοριών. Η πρώτη γενιά του Web αποτελεί ένα παγκόσμιο γράφο που απαρτίζεται από υπερ-συνδέσμους (μέσω URIs πάνω από το Διαδίκτυο) ανάμεσα σε ιστοσελίδες:

2

Ακολούθως, με τα «Κοινωνικά Δίκτυα» το νέο Web2.0 απέκτησε κοινωνική διάσταση (αλληλεπίδραση, συνεργασία των χρηστών, δημιουργία δυναμικών εγγράφων) και Φορείς Παροχής νέων υπηρεσιών (Wikis, Blogs, Flickr, YouTube, MySpace, Facebook, κ.α.), αξιοποιούμενο από οποιονδήποτε, οπουδήποτε υπάρχει διαδικτυακή σύνδεση, με περισσότερα Smartphones από σταθερά PCs. Όμως παρέμειναν στεγανά πληροφορίας (σε απομονωμένα ψηφιακά «σιλό») ή ad hoc συνδέσεις κοινωνικών δικτύων στο κοινωνικό web, χωρίς διαλειτουργικότητα στις μεθόδους, πρωτόκολλα, τεχνολογίες και διαχειριστικά-λειτουργικά όρια για την ταυτοποίηση – εξουσιοδότηση των χρηστών, όσο και στους μορφότυπους και τεχνολογίες αναπαράστασης των ίδιων των δεδομένων και της πληροφορίας, παρά τις όποιες λύσεις Single SignOn. Χαρακτηριστικά παραδείγματα στα επίπεδα του Α.Π.Θ. αλλά και του Ίντερνετ:

3

Η επόμενη γενιά του Παγκόσμιου Σημασιολογικού Ιστού (Web 3.0) θα άρει κάποιες από τις ανωτέρω δυσκολίες, διασυνδέοντας τα δεδομένα με τρόπο που διευκολύνει τη δυνατότητα να συναχθεί το νόημα τους μηχανικά. Έτσι πλέον θα πραγματοποιείται νοηματική επεξεργασία των δεδομένων, τα οποία διασυνδέονται μεταξύ τους με σχέσεις της μορφής: «Υποκείμενο → ρήμα → κατηγόρημα». Οι συλλογισμοί θα αξιοποιούν οντολογίες για την οργάνωση και ιεράρχηση της σημασίας που αποδίδεται στα δεδομένα, ώστε να δημιουργηθεί ένα καθολικό μέσο ανταλλαγής πληροφοριών από τον Ιστό με βάση την σημασία τους (σημασιολογία), με τρόπο κατανοητό από τις μηχανές.

Η σχετική τεχνολογία για την δημοσίευση δομημένων δεδομένων και την διασύνδεση μεταξύ τους ονομάζεται Διασυνδεδεμένα Ανοιχτά Δεδομένα (Linked Open Data). Αυτά υλοποιούνται με τυποποιημένες τεχνολογίες (RDF, OWL, SKOS, SPARQL, κλπ.) και την αρχιτεκτονική να αποτυπώνεται στην παρακάτω στοίβα (ή τούρτα):

Η μονοσήμαντη ταυτοποίηση των πόρων επιτυγχάνεται στο Σημασιολογικό Ιστό μέσω URI/IRI. (Απλές) «οντολογίες» που αναφέρονται ως «λεξιλόγια» ορίζουν τις έννοιες και τις σχέσεις («όρους») οι οποίες χρησιμοποιούνται για να περιγράψουν και να αναπαραστήσουν ένα πεδίο, ταξινομούν τους όρους, χαρακτηρίζουν πιθανές σχέσεις, και καθορίζουν τυχόν περιορισμούς στην χρήση των όρων αυτών.

Στο ακόλουθο νέφος των Συνδεδεμένων Ανοικτών Δεδομένων (έκδοση 2013, των M. Schmachtenberg, C. Bizer, A. Jentzsch, R. Cyganiak. http://lod-cloud.net/) καθένας δικαιούται να εισάγει Σύνολα Δεδομένων του, εφόσον δημοσιεύσει τα δεδομένα σύμφωνα με τις Αρχές των Συνδεδεμένων Δεδομένων.

4

Στον παρακάτω πίνακα συνοψίζονται οι διάφορες γενιές του Web στο χρονικό πλαίσιο τους παραθέτοντας και την πηγή της υπεραξίας που παράγει κάθε μια, ώστε να είναι ευκρινές πως φτάσαμε στο Σημασιολογικό ιστό, αλλά και τι προβλέπουμε να υπάρξει παραπέρα από αυτόν. Όσον αφορά στη μέχρι σήμερα ανάπτυξη και πορεία του Web τα στοιχεία είναι σαφή και προκύπτουν με ευθύ τρόπο. Στις προβλέψεις για την επόμενη γενιά (Web4.0) είναι απαραίτητο να σημειώσουμε το ανατομικό, λειτουργικό και δικτυακό μοντέλο του ανθρώπινου εγκεφάλου ως «ιστός» όπου διαβιβάζονται εντολές για σκέψεις και συμπεριφορές μέσω συγκεκριμένων περιοχών για κάθε λειτουργία, και την αναλογία λειτουργίας του Web ως «παγκόσμιος εγκέφαλος» που θα λειτουργεί ως νευρικό σύστημα σε πλανητικό επίπεδο.

5

Σημαντικό ρόλο στην ανάπτυξη των ιστοχώρων που απαρτίζουν το Web παίζουν τα Πληροφοριακά Συστήματα που ονομάζονται Συστήματα Διαχείρισης Περιεχομένου (ιστοχώρων) (Web) Content Management SystemsCMS και δομούνται από Βάση Δεδομένων, επεξεργαστή ιστοσελίδων (WYSIWYG editor) και εργαλεία για επεξεργασία templates του ιστοχώρου, ώστε να παραχθούν οι ιστοσελίδες (σε HTML μορφή) οι οποίες σερβίρονται πάνω από το Web στους χρήστες του ιστοχώρου. Τα CMS τύπου ΕΛ/ΛΑΚ κατέχουν σημαντικότατο μερίδιο αγοράς. Στην αξιολόγηση των τριών δημοφιλέστερων (Joomla, WordPress και Drupal) ως προς τον προσανατολισμό, την επάρκεια και ωριμότητα υποστήριξης του Σημασιολογικού Ιστού το Drupal αναδεικνύεται ως το πρώτο CMS με εγγενή υποστήριξη RDF και τεχνολογιών Semantic Web. Επιπλέον το Drupal επιλέχθηκε για τη ανάπτυξη Σημασιολογικών Ιστοχώρων στο Α.Π.Θ. λόγω του ευέλικτου συστήματος διαμόρφωσης εμφάνισης (theming), της προηγμένης και φιλικής διεπαφής χρήστη (σχεδιαστή, συντάκτη) και της δόμησης περιεχομένου σε κόμβους, όπου κάθε κόμβος ανήκει σε συγκεκριμένο «τύπο περιεχομένου». Επίσης το Drupal είναι ένα ασφαλές CMS με έγκαιρη και έγκυρη υποστήριξη ασφάλειας και συντήρησης κώδικα, ενώ τέλος παρέχει και πολυγλωσσική υποστήριξη (80 γλώσσες) με καινοτόμους τρόπους μετάφρασης. Στους ιστοχώρους http://www.drupalshowcase.com και https://www.drupal.org/case-studies παρατίθενται παραδείγματα διάσημων φορέων από διάφορους χώρους οι οποίοι έχουν επιλέξει το Drupal ως CMS του ιστοχώρου τους, με το http://drupal.org να αποτελεί το κεντρικό σημείο αναφοράς για όλη την κοινότητας των προγραμματιστών, χρηστών και εταιριών με κύκλο εργασιών πάνω στο Drupal.

Η λειτουργία του RDF στο Drupal 7 κατ’ αρχήν υποστηρίζεται από. Module RDF εντός του πυρήνα του Drupal. Υπάρχει Schema.org module (βλ. http://drupal.org/project/schemaorg), ενώ επιπλέον υποστήριξη RDF δίδεται μέσω RDF επεκτάσεων (βλ. https://www.drupal.org/project/rdfx) για τα RDFx, RDF/XML, NTriples, Turtle, RDF UI, Evoc. Επίσης διαθέτει SPARQL module (βλ. https://www.drupal.org/project/sparql), VARQL module (http://drupal.org/project/varql), RESTful Web Services (http://drupal.org/project/restws), Microdata module (https://www.drupal.org/project/microdata) και Rich Snippets module (http://drupal.org/project/richsnippets). Περισσότερα στο “Introduction to the Semantic Web & RDF in Drupal 7 video” (βλ. https://archive.org/details/IntroductionToTheSemanticWebAndRdfInDrupal7) και στους ιστοχώρους Semantic Web Index – Data Web Services (http://sindice.com/), 3kbo: Στρατηγικές για υλοποίηση εφαρμογών Sem-Web (http://notes.3kbo.com/) και schema.org τα σχήματα του οποίου εισάγονται ως θεμελιώδης τύπος δεδομένων στο Drupal8.

Η ανάπτυξη του Σημασιολογικού ιστού και των Συνδεδεμένων Ανοικτών Δεδομένων στο Α.Π.Θ. παρακινήθηκε από την πολιτική βούληση να ικανοποιηθεί η απαίτηση για Ανοικτά δημόσια δεδομένα, ώστε τα δεδομένα που παράγει ή συλλέγει το δημόσιο να ανήκουν σε όλους (όπου είναι οικονομικά εφικτό και νόμιμο). Το κίνημα για Ανοικτά Δεδομένα που έχει παρόμοιους στόχους με τις κοινότητες για ΕΛ/ΛΑΚ, Ανοιχτό Περιεχόμενο, Ανοικτή Διακυβέρνηση/Πρόσβαση/Επιστήμη βρίσκει τρεις εφαρμογές στο ΑΠΘ: α) εκπαίδευση, β) έρευνα και γ) διοίκηση. Έτσι επιτυγχάνεται η προβολή του συνόλου του ψηφιακού (ανοικτού) περιεχομένου του ΑΠΘ σε όλη την ακαδημαϊκή κοινότητα, δημιουργώντας ανταγωνιστικό πλεονέκτημα για την προβολή και ανάδειξη της γνώσης που παράγεται μέσα στο ΑΠΘ, εφόσον οι παραπάνω αρχές υιοθετηθούν εγκαίρως. Προσδοκώμενο αποτέλεσμα είναι η αύξηση παραγωγικότητας και η αναβάθμιση ηλεκτρονικών υπηρεσιών ΑΠΘ.

Ο οδικός χάρτης για άνοιγμα δεδομένων στο Α.Π.Θ. συνοψίζεται στα 1) Επιλογή του κατάλληλου Συνόλου Δεδομένων, 2) Αδειοδότηση με κατάλληλη «ανοικτή» άδεια, 3) Τεχνική διαδικασία ανοίγματος σε κατάλληλο format (CSV, TSV, XML, RDF, κλπ. …) και 4) Διαφήμιση/προβολή Συνόλου Δεδομένων σε Ιδρυματική πύλη ανοικτών δεδομένων (π.χ. ckan.auth.gr), datahub.io, geodata.gov.gr, openaccess.gr, ckan.okfn.gr, κ.α. Δείγματα των συνδεδεμένων δεδομένων, interfaces και οντολογιών στο Α.Π.Θ., παρουσιάζονται στην ενότητα «Linked ΑΠΘ» του κεντρικού ιστοχώρου του ιδρύματος, όπου δημοσιεύονται ως LOD επιστημονικές δημοσιεύσεις, ερευνητικά έργα και υποτροφίες του πανεπιστημίου:

6

Σχηματικά η μοντελοποίηση κατά RDF που έχει γίνει για την Σχολή Θετικών Επιστημών Α.Π.Θ. εντός του κεντρικού ιστοχώρου Α.Π.Θ. έχει ως εξής:

7

Ο ιστοχώρος του εργαστηρίου Η/Υ του Τμ. Μαθηματικών Α.Π.Θ. (http://clab.math.auth.gr) πέρα από τη γενική περιγραφή που παρέχει, οργανώνεται σε έξι (6) ενότητες όπου περιγράφονται οι παρεχόμενες από το εργαστήριο υπηρεσίες, το διαθέσιμο εκπαιδευτικό λογισμικό, οι ανακοινώσεις με επίκαιρα θέματα, χρήσιμοι σύνδεσμοι, στοιχεία επικοινωνίας με το εργαστήριο και οι δυνατότητες για online δήλωση εργαστηριακού μαθήματος (απευθύνεται αποκλειστικά σε ταυτοποιημένους χρήστες-φοιτητές του Τμήματος Μαθηματικών). Στην πρώτη σελίδα του ιστοχώρου βρίσκονται εύχρηστες συνδέσεις με κοινωνικά δίκτυα που απευθύνονται στους συχνούς χρήστες (σελίδας facebook του Τμ. Μαθηματικών Α.Π.Θ. και σελίδα του Α.Π.Θ. στο Twitter). Σε άλλη ιστοσελίδα λειτουργεί φόρμα δήλωσης εργαστηριακών μαθημάτων:

8

Τα αποτελέσματα των δηλώσεων εξάγονται κατ’ απαίτηση του αρμόδιου διαχειριστή ή διδάσκοντα:

9

Στον ιστοχώρο έχει δημιουργηθεί ημερολόγιο όπου αναρτώνται όλα τα εργαστηριακά μαθήματα που γίνονται στις δύο αίθουσες Η/Υ, ώστε να ενημερώνονται έγκαιρα και εύκολα πάνω από το ίντερνετ οι ενδιαφερόμενοι να παρακολουθήσουν τα μαθήματα ή να αιτηθούν κράτηση των αιθουσών Η/Υ για ακαδημαϊκές δραστηριότητες.

10

Μια τυπική εικόνα εμφάνισης του ημερολογίου σε μηναία βάση φαίνεται παραπάνω. Παρόμοιος μηχανισμός ημερολογίου έχει αξιοποιηθεί και για τη δήλωση παρουσιών των εθελοντών φοιτητών που απασχολούνται ως εκπαιδευόμενοι στο εργαστήριο Η/Υ. Τέλος ο ιστοχώρος αξιοποιεί την εξωτερική υπηρεσία Google analytics για την συλλογή και επεξεργασία χρήσιμων στατιστικών που αφορούν στην πρόσβαση, δημοφιλία και αποτελεσματικότητα του.

Στο νέο υπό κατασκευή ιστοχώρο της Σχολής Θετικών Επιστημών του Α.Π.Θ. θα εισαχθούν καινοτομίες όπως: α) ενότητα για την παρουσίαση και ανάδειξη των εργαστηρίων σε επίπεδο Σχολής, β) ροές ειδήσεων εισαγόμενες από άλλους ιστοχώρους Drupal του Α.Π.Θ. ώστε να εμφανίζονται αυτόματα στην ενότητα «Επικαιρότητα», εκτός από τα Νέα της ΣΘΕ, ειδήσεις που προέρχονται από ιστοχώρους Τμημάτων της ΣΘΕ αλλά και τον κεντρικό ιστοχώρο του πανεπιστημίου. Έτσι ο χρήστης αποκτά συνολικότερη εικόνα της επικαιρότητας με κέντρο τη Σχολή Θετικών Επιστημών με μια ματιά.

11

γ) τύπος περιεχομένου Timeline, που θα αποτυπώνει την ιστορία της ΣΘΕ σε διάταξη εικόνων με συνοδευτικά κείμενα και χρονολογίες, μέσω ειδικού Drupal moduleSimple Timeline”.

12

Από τα προαναφερθέντα συμπεραίνουμε ότι το Drupal συνδυάζει με επιτυχία ΕΛ/ΛΑΚ και LOD και είναι κατάλληλο ως σημείο εκκίνησης για όποιον 1) δεν έχει πολλά/μεγάλα σύνολα δεδομένων να ανοίξει και διασυνδέσει σημασιολογικά, 2) θέλει να εξοικειωθεί με τις σχετικές τεχνολογίες, 3)θέλει να δοκιμάσει πιλοτικά την ανάπτυξη LOD, χωρίς να επενδύσει από την αρχή σε πολλά Πληροφοριακά Συστήμα (π.χ. CKAN, Virtuoso, κλπ.). Το ΕΛ/ΛΑΚ και τα LOD είναι συνεργατικά μοντέλα που απαιτούν συμμετοχή (communities) με ικανό μέγεθος για να αποδώσουν. Όμως η συμμετοχή των εμπλεκομένων μερών πρέπει να ωθείται και από οικονομικά κίνητρα για να μπορεί να είναι επαγγελματικού επιπέδου και σε μακροχρόνια και αδιάληπτη προοπτική. Η ωρίμανση των Συνδεδεμένων Ανοικτών Δεδομένων θα ωφεληθεί από την υιοθέτηση του μοντέλου λειτουργίας και των προϊόντων του ΕΛ/ΛΑΚ. Επισημαίνεται ότι τα τεχνολογικά προβλήματα είναι ευκολότερα από την απαιτούμενη αλλαγή νοοτροπίας. Η εκπαίδευση και η εκπαιδευτική κοινότητα είναι παράγοντας κλειδί για την αλλαγή νοοτροπίας, τη μετάβαση στην επόμενη γενιά διαθέσιμου λογισμικού, δεδομένων και την ανάπτυξη με αυτά του Web of Knowledge.

One thought on “Ανοικτά Δεδομένα και Σημασιολογικός Ιστός με το ΕΛ/ΛΑΚ CMS Drupal στο Α.Π.Θ., εργαστήριο Η/Υ Τμ. Μαθηματικών, νέος ιστοχώρος Σ.Θ.Ε.

Leave a Comment