Μαθήματα Κατεύθυνσης
Ανάκτηση και εξόρυξη πληροφοριών
- ΠΕΡΙΕΧΟΜΕΝΟ ΜΑΘΗΜΑΤΟΣ
-
Περιεχόμενα: Διαδίκτυο και μηχανές αναζήτησης. Συλλογή, προεπεξεργασία, ευρετηριασμός, αποθήκευση, και οργάνωση κειμένων. Μοντέλα ανάκτησης πληροφορίας (Boolean, Διανυσματικό, Πιθανοτικό). Ανάκτηση ανεκτική σε λάθη. Μετρικές αξιολόγησης ανάκτησης και συλλογές κειμένων αναφοράς. Επίπεδη και ιεραρχική ομαδοποίηση κειμένων. Κατηγοριοποίηση κειμένων (Naïve Bayes και διανυσματική). Ανάλυση υπερσυνδέσμων. Εξόρυξη προτύπων. Γλωσσικά μοντέλα.
- ΑΞΙΟΛΟΓΗΣΗ ΦΟΙΤΗΤΩΝ
-
Αξιολόγηση: Προγραμματιστικές εργασίες (ενδέχεται να συνοδεύονται από προσωπική εξέταση) ή/και ασκήσεις κατανόησης της ύλης (είτε για το σπίτι, είτε για επίλυση στην τάξη), και 3ωρη γραπτή τελική εξέταση. Οι εργασίες και οι ασκήσεις θα έχουν συνολικό βάρος 50%, όπως και η τελική γραπτή εξέταση. Τα ποσοστά αυτά μπορεί να διαφοροποιούνται (μέχρι +/-10%) από έτος σε έτος. Για την επιτυχία ενός φοιτητή στο μάθημα απαιτείται προβιβάσιμος βαθμός (πέντε ή μεγαλύτερος) στην τελική γραπτή εξέταση καθώς και στον τελικό βαθμό όπως αυτός προκύπτει από τα εκάστοτε ποσοστά.
Μέθοδοι αξιολόγησης: Ερωτήσεις σύντομης απάντησης, Επίλυση προβλημάτων, Έκθεση / Αναφορά, Προφορική εξέταση.
- URL ΜΑΘΗΜΑΤΟΣ ΣΤΟ ECLASS
- ΣΥΝΙΣΤΩΜΕΝΗ ΒΙΒΛΙΟΓΡΑΦΙΑ
-
Βιβλιογραφία:
- C. Manning, P. Raghavan, H. Schutze, Εισαγωγή στην ανάκτηση πληροφοριών, 1η έκδοση, Κλειδάριθμος, 2012. Κωδικός στον Εύδοξο: 12532681
- Μ. Βαζιργιάννης, Μ. Χαλκίδη, Εξόρυξη γνώσης από βάσεις δεδομένων και τον παγκόσμιο ιστό, 2η έκδοση, Τυπωθήτω, 2005. Κωδικός στον Εύδοξο: 31391
- A. Langville, C. Meyer, Η μέθοδος PageRank της Google και άλλα συστήματα κατάταξης, 1η έκδοση, Πανεπιστημιακές Εκδόσεις Κρήτης, 2010. Κωδικός στον Εύδοξο: 7753
- R. Baeza-Yates, B. Ribeiro-Neto, Ανάκτηση Πληροφορίας, 2η έκδοση, Τζιόλα, 2014. ISBN: 978-960-418-460- 6. Κωδικός στον Εύδοξο: 41954965