top of page

Açık Arşivlerde Temel Üst Veri Alanları

Yazarın fotoğrafı: Research EcosystemsResearch Ecosystems

Açık arşivler, bilimsel bilginin daha geniş kitlelere erişilebilir olmasını sağlayan dijital depolardır. Akademik çalışmaların, makalelerin, tezlerin ve raporların bu tür platformlarda saklanması, araştırmacılar için büyük bir avantaj sunar. Geleneksel akademik yayıncılık sisteminde, bilimsel makalelere erişim çoğu zaman abonelik gerektirirken, açık arşivler bu kısıtlamayı ortadan kaldırarak bilginin özgürce paylaşılmasını teşvik eder. Bu ihtiyacın sonucu olarak 1990’ların sonunda açık erişim hareketi doğmuş ve araştırmacılar çalışmalarını herkesin ulaşabileceği şekilde yayınlamaya yönelmiştir. Ancak, artan içerik hacmi; bilginin düzenlenmesi ve keşfedilmesini zorlaştırmaktadır. Bu noktada, yapay zeka; açık arşivlerin etkinliğini artıran önemli bir araç haline gelmiştir. Doğal dil işleme teknikleri, bilimsel makalelerin içeriklerine göre otomatik olarak sınıflandırılmasını ve üst verilerinin zenginleştirilmesini sağlayarak, araştırmacıların aradıkları bilgilere daha hızlı ulaşmalarına yardımcı olur.


Ayrıca, yapay zeka destekli sistemler; açık arşivlerdeki verileri analiz ederek bilimsel eğilimleri ortaya çıkarabilir ve yeni araştırma alanlarını öngörebilir. Böylece açık arşivler; sadece bilimsel çalışmaların depolandığı platformlar olmaktan çıkıp, dinamik bir bilgi ekosistemi haline gelerek araştırmacılar için daha verimli bir keşif imkanı sağlar.


Arşivler Girişimi (Open Archives Initiative - OAI) ile olmuştur. OAI; açık arşivlerin ortak bir standart çerçevesinde çalışmasını sağlayarak, bilimsel içeriklerin daha verimli bir şekilde paylaşılmasını amaçlayan bir girişimdir. Özellikle OAI-PMH (Open Archives Initiative Protocol for Metadata Harvesting) adlı protokol; açık arşivlerin birbirleriyle veri paylaşabilmesine imkan sağlar. Bu sayede farklı açık arşivlerde bulunan bilimsel çalışmalar, merkezi dizinleme sistemleri tarafından kolayca taranabilir ve araştırmacılar tarafından daha hızlı bulunabilir.


OAI’nin bu işlevselliğini sağlayan en önemli unsur ise üst veridir (metadata). Üst veri, bir akademik çalışmayı tanımlayan ve onu kategorize eden bilgileri içeren yapılardır. Bir makalenin başlığı, yazarı, yayımlandığı tarih, özet bilgisi ve konu başlıkları gibi unsurlar; üst verinin temel bileşenleridir. Üst verinin standartlaştırılması sayesinde, farklı açık arşivler arasında veri paylaşımı ve entegrasyonu kolaylaşır. Örneğin, bir araştırmacı belirli bir konu hakkında literatür taraması yaparken, OAI-PMH aracılığıyla indekslenen üst veri sayesinde farklı platformlardaki kaynakları tek bir yerden bulabilir.

 

OAI-PMH protokolü, üst veri paylaşımında genellikle Dublin Core (DC) şemasını kullanmaktadır. Dublin Core standardı; açık arşivlerde yer alan akademik çalışmaların tanımlanmasını, organize edilmesini ve bulunabilirliğini kolaylaştıran bir üst veri (metadata) standardıdır. Açık arşivlerin temel amacı; bilimsel bilginin geniş kitlelere erişilebilir olmasını sağlamak olduğundan, bu bilgilerin belirli bir düzen içinde tanımlanması ve paylaşılması büyük önem taşımaktadır.


Bibliyografik Üst Veri Alanları

Bu alanlar, dijital içeriği tanımlayan temel bilgileri içerir:

  • Başlık (Title): Eserin veya yayının adıdır.

  • Yazar (Creator/Author): İçeriği oluşturan kişi, kurum veya araştırma ekibidir.

  • Konu (Subject): Yayının ele aldığı ana temaları veya anahtar kelimeleri ifade eder.

  • Özet (Description): Kaynağın kısa bir tanıtımıdır.

  • Yayıncı (Publisher): Yayının hangi kurum veya kişi tarafından yayımlandığı bilgisidir.

  • Dil (Language): Kaynağın yazıldığı dili belirtir.

  • Veri Setinin Adı (Dataset Title): Veri setinin ne olduğunu açıkça belirtir ve akılda kalıcı olmasını sağlar.

  • Zaman ve Bölge Bilgisi (Temporal and Spatial Information): Veri setinin kapsadığı zaman dilimi ve ilgili coğrafi bölgeye ilişkin ayrıntıları belirtir.

  • Son Düzenleme Tarihi (Last Modified Date): Veri setinde en son yapılan düzenleme veya güncellemeyi belirtir.

  • Kategori/Tema (Category/Theme): Veri setinin ait olduğu alanı belirtir. (örneğin, ulaşım, finans, eğitim vb.)


Kimlik ve Erişim Bilgileri

Bu alanlar, içeriğin benzersiz şekilde tanımlanmasını ve erişilebilir olmasını sağlar:

  • Kimlik Numarası (Identifier): DOI (Digital Object Identifier), ISSN, ISBN veya URL gibi benzersiz tanımlayıcıları belirtir.

  • Tarih (Date): Eserin oluşturulma, yayımlanma veya değiştirilme tarihini belirtir.

  • Kaynak Türü (Type): Makale, tez, rapor, sunum gibi içeriğin türünü belirten alandır.

  • Format (Format): PDF, HTML, XML gibi dosya formatı bilgisini içerir.


Haklar ve Lisans Bilgileri

Bu alanlar, içeriğin telif hakkı durumunu ve kullanım şartlarını belirtmek için kullanılır:

  • Haklar (Rights): İçeriğin kullanım şartları hakkında bilgi verir.

  • Lisans (License): Creative Commons veya diğer lisanslama sistemlerine uygunluğunu belirtir.


 

Dublin Core şemasının, açık arşivlerdeki en büyük katkısı; farklı sistemlerin ve platformların birbiriyle uyumlu hale gelmesini sağlamasıdır. Farklı üniversiteler, araştırma kurumları veya veri tabanları; açık arşivleri kullanırken farklı veri giriş formatları kullanabilir. Ancak Dublin Core gibi uluslararası kabul görmüş bir standart kullanıldığında, bu veriler ortak bir yapıya kavuşur ve farklı sistemler arasında, verilerin paylaşılabilmesine imkan sağlar. 


Bunun yanı sıra, Dublin Core sayesinde açık arşivlerdeki akademik içerikler arama motorları ve indeksleme sistemleri tarafından daha kolay taranır. Örneğin; Google Scholar, OpenAIRE, BASE ve OAI-PMH gibi platformlar; Dublin Core ile tanımlanmış üst verileri kullanarak makaleleri indeksler ve araştırmacıların aradıkları içeriklere daha hızlı ulaşmasını sağlar.


Ayrıca, Dublin Core şemasının sağladığı standart üst veri elemanları (başlık, yazar, konu, tarih vb.); açık arşivlerde bulunan bilimsel çalışmaların daha düzenli, anlaşılır ve yapılandırılmış bir şekilde sunulmasını sağlar. Bu sayede akademik içeriklerin erişilebilirliği ve sürdürülebilirliği artar.


Dublin Core gibi üst veri standartları; açık arşivlerde bilimsel bilginin FAIR prensiplerine uygun olmasını sağlayarak verilerin ve üst verilerin bilimsel ekosistemde daha etkin şekilde kullanılmasına katkıda bulunur.


Açık arşivlerde kullanılan üst veriler de Linked Data ve RDF (Resource Description Framework) gibi semantik web teknolojileriyle bütünleştiğinde:

  • Makine tarafından anlaşılabilir bilgi: Üst verilerin standartlara uygun biçimde tanımlanması, arama motorlarının ve yapay zekâ sistemlerinin içerikleri daha iyi anlamasını sağlar.


  • Bağlantılı açık veriler (Linked Open Data - LOD): Açık arşivler, diğer akademik veri tabanlarıyla bağlantılı hale getirilerek küresel bilgi ağları oluşturabilir.


  • Otomatik bilgi keşfi: Semantik web teknikleri sayesinde ilgili çalışmalar arasında otomatik bağlantılar kurulabilir, böylece araştırmacılar için daha iyi öneriler sunulabilir.


Sonuç olarak; açık arşivler bilimsel bilginin erişilebilirliğini artıran ve akademik dünyada bilgi paylaşımını kolaylaştıran önemli yapılardır. Ancak bu sistemlerin etkili bir şekilde işleyebilmesi için doğru üst veri kullanımının büyük bir rolü vardır. Araştırmacılar, kütüphaneciler ve akademik platform yöneticileri; standart üst veri şemalarını takip ederek bilgi kaynaklarının uzun vadeli bulunabilirliğini ve düzenini sağlamalıdır. Bu sayede; açık arşivlerde kullanılan üst veri alanları bilginin keşfini, erişimini ve uzun vadeli korumasını sağlarken, semantik web teknolojileriyle entegre edildiğinde daha akıllı ve bağlantılı bir akademik ekosistemin bir parçası haline gelir.


Research Ecosystems olarak ürünümüz GCRIS; Dublin Core standartlarını kullanmakta ve üst veri hazırlamaktayız. Kaynaklardan gelen verileri üst veri zenginleştirmesi ile daha keşfedilebilir hale getirirken, farklı veri kaynaklarından alınan üst verileri analiz edip optimize ediyor ve standartlara uygun hale getiriyoruz. Böylece, akademik kaynakların erişilebilirliğini ve düzenlenmesini sağlarken, araştırmacılar için daha kapsamlı ve bağlantılı bir bilgi ekosistemi oluşturuyoruz.


Comments


Research Ecosystems'i takip edin et

  • Facebook

©2024 GCRIS, tüm hakları saklıdır. Research Ecosystems tarafından yapıldı.

bottom of page