31 Temmuz 2017 Pazartesi

Designing an Information Retrieval System for Learning Experiences in the Virtual Environments - Section 5 - CONLUSION AND RECOMMENDATIONS

Sanal Ortamlardaki Öğrenme Deneyimleri İçin Bir Enformasyon Erişim Sistemi Tasarımı - Bölüm 5

SONUÇ VE ÖNERİLER



Tasarlanan sistem "Verilen bir konuyla hangi zaman aralığında ve hangi sıklıkta ilgilenildi?" sorusuna yanıt bulma ve verilen bir konu üzerindeki çalışmayı zaman ekseninde görsel olarak tekrar canlandırabilme gibi olanaklar sunmaktadır. Bu özellikleri nedeniyle geliştirilen sistem kişisel ve kurumsal bilgi çalışmasını destekleyen bir “kişisel enformasyon yönetim sistemi” aracıdır. Bu aracın, özellikle kişisel ve kurumsal öğrenme ortamları başta olmak üzere, bütün bilgi çalışması ortamlarındaki etkisi ayrıca incelenmelidir. 


Yaşam günlüğü yaklaşımıyla tasarlanan görüntü yakalama ve metin elde etme sistemi kullanıcının aktif davranışlarına gerek duymadan pasif bir biçimde kendiliğinden ve sürekli biçimde çalışmaktadır. Sistem kullanıcının oturum açtığı yeni bir bilgisayara M-Levels1 yazılımını kurulmasıyla basitçe genişletilebilmektedir. Kullanıcı sadece M-Levels2 yazılımını kurulu olduğu çalışma bilgisayarında indeksi güncellemek ve anahtar sözcüklerle arama yapmak gibi aktif davranış sergilemektedir. Bu yönüyle sistem kullanımı basit ve kolayca genişletilebilir bir tasarıma sahiptir. 


Ekran görüntüsünden metin elde etme yaklaşımı ekranın duyarlılığına, ekrandaki metinlerin yazı büyüklüğüne ve yazı tipine sıkı sıkıya bağımlıdır. Bazı yazı tipleri ve küçük yazı boyları metinlerin doğru elde edilmesini engelleyebilmektedir. Diğer taraftan ekranda üst üste binmiş pencerelerin varlığı da hem bazı sözcüklerin görünmesini, hem de sözcüğün bütün harflerinin görünmesini engelleyebilir. Bu sorunlar elde edilen ekran metinlerinin kesinliğini etkilemekle birlikte gün boyunca yüzlerce ekran görüntüsünün yakalanması nedeniyle metinlerin ekran görüntülerinde yer alma sıklığının "niteliğini" fazla etkilemeyecektir. Diğer bir deyişle, bir sözcüğün zaman boyunca dalgalanan sıklık dağılımındaki miktarlar kesin olmamakla birlikte dalganın yapısı gerçek durumdan çok uzak olmayacaktır. 


Uygulanan yaklaşım "anımsama" açısından yaklaşıldığında, kullanıcının görmediği sözcükleri anımsamayacağı gerçeğiyle uyumludur. Böylece bir pencerenin arkasında kaldığından dolayı görülmeyen bir belge kullanıcının deneyiminin bir parçası haline gelmeyecektir. Yaşanan bir bilgi çalışması deneyimi anında ekranda görünen sözcükler dosyalanmış belgelerin içinde yer alan sözcüklerle karşılaştırılırsa; bilgisayar ekranında sosyal medya iletişimleri, film altyazıları, web sitelerindeki reklam metinleri gibi geleneksel masaüstü arama motorlarının indeksleyemediği sözcüklerin de bulunduğu görülür. Bu sürecin olumsuz yanı ise masaüstündeki uygulama kısa yollarının isimleri, uygulamalardaki menüler, araç çubuklarına ve iletişim pencerelerindeki metinler gibi bilgi çalışması içeriği olarak tanımlanamayacak arayüz sözcüklerinin de indekslenebilmesidir. 


Tasarlanan sisteme ait geliştirilen prototip yazılımın sadece Windows 8.1 ve üstü işletim sisteminde masaüstü ortamında çalışma kısıtlılığı bulunmaktadır. Fakat içerdiği işlevlerin diğer işletim sistemlerine taşınmasında bir engel bulunmamaktadır. Diğer taraftan, bilgi çalışanlarının kişisel ve kurumsal bilgi çalışmalarını üzerinde gerçekleştirdikleri önemli bir diğer cihaz olan akıllı telefonlara, güvenlik nedeniyle akıllı telefonlarda genel amaçlı ekran görüntüsü yakalama işlevinin kısıtlanmasından dolayı, bu sistemde yer verilmemiştir. 


Sistemin gelecekte, çoklu anahtar sözcüklerin dağılımını üst üste gösterecek biçimde geliştirilmesiyle, Google Trends hizmetinde olduğu gibi üzerinde çalışılan konuların birbiriyle zamansal ilişkisi görüntülenebilir hale gelecektir. Diğer taraftan, bu çalışmada geliştirilen sistem, bireylerin geçmiş deneyimlerindeki ilgilendikleri konulara ait "konu çözümlemesi" yapılmasına olanak sağlayan bir sistemin tasarlanması için bir başlangıç noktası oluşturacaktır. 


Not 1: Bu çalışma Türkiye Bilimsel ve Teknik Araştırmalar Kurumu (TÜBİTAK) tarafından 115K497 nolu araştırma projesi kapsamında desteklenmiştir. 


Not 2: Bu çalışma 13- 15 Mayıs 2016 tarihlerinde Antalya’da 10 Ülkenin katılımıyla düzenlenen 7th International Congress on New Trends in Education – ICONTE’de sözlü bildiri olarak sunulmuştur.




KAYNAKÇA 


Alonso, O., Baeza-Yates, R., & Gertz, M. (2007). Exploratory search using timelines. In SIGCHI 2007 Workshop on Exploratory Search and HCI Workshop, No.1, pp.1-4. 


Apache (2016a). Lucene search engine library. Retrieved April 1, 2016 from http://lucene.apache.org/. 


Apache (2016b). Lucene.Net search engine library. Retrieved April 1, 2016 from https://lucenenet.apache.org/. Archive (2016). Internet archive. Retrieved April 1, 2016 from http://www.archive.org. 


AutoHotkey (2016). Retrieved April 1, 2016 from https://autohotkey.com/. 


Bell, G. & Gemmell, J. (2009). Total recall: how the e-memory revolution will change everything. Penguin Books. 


Bloomberg, D. (2016). Leptonica. Retrieved April 1, 2016 from http://www.leptonica.com. 


Capture2Text (2016). Retrieved April 1, 2016 from http://capture2text.sourceforge.net/.


Chen, Y., & Jones, G. J. F. (2009). A pilot study to explore digital elements for visualizing time in personal information re-finding. 3rd Irish HCI Conference. Copernic (2016). 


Copernic desktop search. Retrieved April 1, 2016 from http://www.copernic.com/. 


DocFetcher (2016). Docfetcher open source desktop search. Retrieved April 1, 2016 from http://docfetcher.sourceforge.net/en/index.html. 


Efendioglu, D., Faschetti, C., & Parr, T. (2006). Chronica: a temporal web search engine. In Proceedings of the 6th International Conference on Web Engineering, ACM, pp. 119-120. 


Einsele-Aazami, F. (2008). Recognition of ultra low resolution, anti-aliased text with small font sizes. Phd. Dissertation, Department of Computer Science - University of Fribourg. Switzerland. 


Foo, S., & Hendry, D. (2007). Desktop search engine visualisation and evaluation. In Asian Digital Libraries. Looking Back 10 Years and Forging New Frontiers (pp. 372-382). Springer Berlin Heidelberg. 


Freeman, E. & Fertig, S. (1995). Lifestreams: organizing your electronic life. In R.Burke (Ed.), AI Applications in Knowledge Navigation and Retrieval. AAAI Press. Gholam, M. (2013). 


Hoot full text search engine. Retrieved April 1, 2016 from http://www.codeproject.com/Articles/224722/hOOt-full-text-search-engine 


Gleichman, S., Ophir, B., Geva, A., Marder, M., Barkan, E., & Packer, E. (2011). Detection and segmentation of antialiased text in screen images. In International Conference On Document Analysis And Recognition (ICDAR), ıeee, pp. 424-428. 


Google (2016). Google trends. Retrieved April 1, 2016 from https://www.google.com/trends/. 


Gurrin, C. (2012). Living with sensecam: experiences, motivations and advances. In: SenseCam 2012, Oxford, UK. 


Gurrin, C., Smeaton, A. F., & Doherty, A. R. (2014). Lifelogging: personal big data, Foundations and Trends in Information Retrieval, 8(1), 1-125. 


Jin, P., Lian, J., Zhao, X., & Wan, S. (2008). Tise: a temporal search engine for web contents, In Intelligent Information Technology Application 2008. IITA'08. Second International Symposium, IEEE, Vol. 3, pp. 220-224. 


Jones, W. (2008). Keeping found things found, Morgan Kaufmann Publishers. 


Khare, R., Cutting, D., Sitaker, K., & Rifkin, A. (2004). Nutch: a flexible and scalable open-source web search engine. CommerceNet Labs. CN-TR-04-04. Retrieved April 1, 2016 from http://www.master.netseven.it/files/262-Nutch.pdf. 


Kimura, T., Huang, R., Uchida, S., Iwamura, M., Omachi, S., & Kise, K. (2013). The reading-life log--technologies to recognize texts that we read. In 12th International Conference on Document Analysis and Recognition (ICDAR), IEEE, pp. 91-95. 


Mohamed, E. S. T. (2013). Designing and evaluating a user ınterface for continous embedded lifelogging based on physical context. Ph.D.Thesis, Newcastle University, 2013. 


Mutlu, M. E. (2014). Çoklu cihazlı ve çoklu algılayıcılı yaşam günlüğü ile öğrenme deneyimlerinin yakalanması için bir çerçeve önerisi, Asya Öğretim Dergisi (Asian Journal of Instruction), 2014 – 2(1(ÖZEL)), 1-17.


Mutlu, M.E. (2013). Öğrenme deneyimlerinin kaydedilmesi için çoklu cihaz tabanlı bir yaşam günlüğü sisteminin geliştirilmesi. Eğitim ve Öğretim Araştırmaları Dergisi (JRET), 2(4), 256-269. 


Mutlu, M.E. (2015). Yaşam deneyimleri için bir bağlam modeli – LECOM. AB’15 – XVII. Akademik Bilişim Konferansı, Anadolu Üniversitesi Eskişehir. 


Mutlu, M.E. (2016a). [Çalışma raporu] Yaşam günlüğü için ekran görüntüsü yakalama - OCR sürümü. 1.4.2016 tarihinde http://personalinformationsystems.blogspot.com.tr/2016/03/working-paper-screen-capture-for.html adresinden alınmıştır. 


Mutlu, M.E. (2016b). [Çalışma raporu] Geçmişteki ekran görüntülerine anahtar sözcüklerle erişme, 1.4.2016 tarihinde http://kisiselogrenmeortamlari.blogspot.com.tr/2016/04/working-paper-access-to-past.html adresinden alınmıştır. 


Ounis, I., Amati, G., Plachouras, V., He, B., Macdonald, C., & Lioma, C. (2006). Terrier: a high performance and scalable ınformation retrieval platform, In Proceedings of the OSIR Workshop, pp. 18-25, 2006. 


Picault, J., Ribière, M., & Senot, C. (2010). Beyond life streams: activities and ıntentions for managing personal digital memories, In The International Workshop on Adaptation, Personalization and Recommendation in the Social-semantic web (APRESW 2010), CEUR-WS, Vol. 585, pp. 25-32. 


Protalinski, E. (2010). Mastering Windows Search using Advanced Query Syntax. Ars Technica. Condé Nast Digital. Retrieved April 1, 2016 from http://arstechnica.com/information-technology/2010/03/masteringwindows-search-using-advanced-query-syntax/. 


Rashid, S. F., Shafait, F., & Breuel, T. M. (2011). An Evaluation of HMM-based Techniques for the Recognition of Screen Rendered Text, In International Conference on Document Analysis and Recognition (ICDAR), IEEE, pp. 1260-1264, 


Shimmy, J. (2012). Wpf toolkit data visualization. Retrieved April 1, 2016 from https://www.nuget.org/packages/WPFToolkit.DataVisualization/. 


Sellen A. J. ve Whittaker, S. (2010). Beyond total capture: a constructive critique of lifelogging. Commun. ACM, vol. 53, no. 5, pp.70–77. 


Smith, R. (2007). An overview of the tesseract OCR engine, In International Conference on Document Analysis and Recognition (ICDAR), IEEE, pp. 629-633. 


Tesseract (2016). Retrieved April 1, 2016 from https://github.com/tesseract-ocr 


Vossen, P., Rigau, G., Serafini, L., Stouten, P., Irving, F., & Hage, W. V. (2014). Newsreader: recording history from daily news streams. In Proceedings of the Ninth International Conference on Language Resources and Evaluation (LREC'14), pp. 2000-2007. 


Wachenfeld, S., Klein, H. U., & Jiang, X. (2006). Recognition of screen-rendered text. In 18th International Conference on Pattern Recognition (ICPR 2006), IEEE, pp.1086-1089. 


Wikipedia (2016a). List of web archive initiatives. Retrieved April 1, 2016 from https://en.wikipedia.org/wiki/List_of_Web_archiving_initiatives 


Wikipedia (2016b). Optical character recognition. Retrieved April 1, 2016 from http://en.wikipedia.org/wiki/Optical_character_recognition.


X1 (2016). X1 Search. Retrieved April 1, 2016 from http://www.x1.com/products/x1_search/


[*] Bu bölümün yazılmasında “Mutlu, M.E. (2016). Sanal Ortamlardaki Öğrenme Deneyimleri İçin Bir Enformasyon Erişim Sistemi Tasarımı, 7. Uluslararası Eğitimde Yeni Eğilimler Kongresi – ICONTE 2016, 13-15 Mayıs 2016 , Antalya“ kaynağından yararlanılmıştır.