Kamis, 06 Januari 2022

Pengumuman penutupan Microsoft Academic


 Pengumuman penutupan Microsoft Academic akhir tahun ini, mungkin telah membuat komunitas riset sebagian besar tidak tergerak, meskipun kehancurannya memiliki implikasi signifikan bagi mereka yang bekerja dengan basis data substansial layanan. Di sini, Aaron Tay, Alberto Martín-Martín, dan Sven E. Hug¸ membahas apa yang membedakan Microsoft Academic dari para pesaingnya dan konsekuensi potensial dari penarikan Microsoft dari metadata ilmiah untuk pengembangan infrastruktur penelitian terbuka.

Baru-baru ini, Microsoft mengumumkan akan menutup Microsoft Academic, mesin pencari akademik terbesar kedua setelah Google Cendekia. Meskipun komunitas ilmiah global tidak terlalu memperhatikan pengumuman ini, banyak ilmuwan komputer, meta-peneliti, pustakawan, dan pemula terkejut, karena mereka telah membangun ekosistem layanan informasi di sekitar basis data.

Microsoft Academic bukanlah upaya pertama perusahaan untuk membangun alat pencarian literatur. Proyek sebelumnya, Microsoft Academic Search, berjalan dari 2009 hingga 2012 dan mengalami kerusakan parah sebelum diluncurkan kembali secara resmi sebagai Microsoft Academic pada 2016. Ini menunjukkan bagaimana Microsoft tidak pernah berniat memasuki bisnis metadata ilmiah. Sebagai gantinya, raksasa teknologi tersebut telah menggunakan data pada komunikasi ilmiah sebagai tempat pengujian untuk data besar dan teknologi kecerdasan buatan (AI), seperti yang disarankan oleh sebuah artikel baru-baru ini oleh para peneliti Redmond. Dikabarkan bahwa Microsoft mungkin menawarkan teknologi yang diuji untuk mengumpulkan pengetahuan dari dokumen di Office 365.

Mesin pencari yang canggih

Dibandingkan dengan indeks kutipan tradisional, seperti Web of Science dan Scopus, sebagian besar didasarkan pada jurnal tertentu, kekuatan Microsoft Academic adalah cara merayapi web dan penggunaan teknologi AI untuk mengisi basis datanya. Oleh karena itu, tidak mengherankan bahwa Microsoft Academic lebih cepat dalam mengindeks publikasi baru dan berisi lebih banyak catatan (194 juta, tanpa paten) daripada Koleksi Inti Web of Science (79 juta) dan Scopus (75 juta). Microsoft Academic juga mencakup lebih banyak jenis publikasi (pracetak, kertas kerja, disertasi, dll.) dan bersinar di bidang penelitian yang database kutipan tradisional sering tidak tercakup dengan baik, seperti ilmu komputer, ilmu sosial, dan humaniora.

 Kekuatan Microsoft Academic adalah cara merayapi web dan penggunaan teknologi AI untuk mengisi basis datanya.

Keuntungan utama dari Microsoft Academic dibandingkan Google Scholar adalah antarmuka pencarian, yang untuk saat ini masih menawarkan banyak pilihan pemfilteran dan penyortiran dan menyediakan berbagai peringkat (topik, jurnal, institusi, dll.) serta visualisasi statistik ringkasan. Meskipun mesin pencari ini gratis dan memiliki jejaring sosial terintegrasi untuk akademisi, mesin pencari ini tidak pernah populer di kalangan peneliti, seperti yang dapat dilihat dari statistik lalu lintas web:

Total kunjungan pada April 2021 menurut SimilarWeb (dalam juta)

scholar.google.com 137.5

semanticscholar.org 8.9

scopus.com 5.2

webofknowledge.com 4.4

akademic.microsoft.com 0.7

Alasan utama untuk penggunaan yang rendah ini kemungkinan adalah antarmuka pencarian itu sendiri. Ini berbeda secara fundamental dari sistem pencarian akademis tradisional karena didorong oleh teknologi AI. Secara khusus, antarmuka menawarkan pencarian semantik yang sebenarnya, bukan pencarian kata kunci biasa dengan operator Boolean. Atau seperti yang pernah dijelaskan Microsoft: 'Microsoft Academic memahami arti kata, tidak hanya mencocokkan kata kunci dengan konten. Misalnya, ketika Anda mengetik "Microsoft", ia tahu maksud Anda institusi, dan menunjukkan kepada Anda publikasi yang ditulis oleh peneliti yang berafiliasi dengan Microsoft.' Selain itu, mesin pencari didasarkan pada lebih dari 700.000 'bidang studi' (yaitu, topik atau konsep) yang dibuat dan terus dikembangkan oleh algoritme, sedangkan sistem pencarian lain menggunakan klasifikasi yang tetap, dikuratori oleh manusia, dan tidak terlalu rumit. Selain itu, mesin pencari menggunakan dua metrik unik, saliency dan perkiraan jumlah kutipan, yang sulit dipahami dan ditafsirkan oleh sebagian besar pengguna. Secara keseluruhan, fitur-fitur berbasis AI ini menciptakan pengalaman pencarian yang sangat berbeda dari yang biasa digunakan pengguna. Dengan demikian, tampaknya teknologi AI yang digunakan terlalu avant-garde untuk pengguna atau tidak cukup matang.

Tersedia Banyak data gratis di Microsoft Academic

Sementara mesin pencari belum dianut oleh komunitas ilmiah, data yang mendasarinya, Grafik Akademik Microsoft, telah menarik banyak pengguna. Ada beberapa alasan untuk ini. Kumpulan datanya sangat besar, terstruktur dengan baik, dan terperinci. Penggunaannya gratis, dan aksesnya mudah (API atau dump data penuh). Sebaliknya, akses langsung ke data Google Cendekia tidak mungkin, dan data hanya dapat diambil dari Google Cendekia sampai batas yang sangat terbatas. Meskipun Microsoft secara eksklusif menggunakan teknologi AI untuk mengumpulkan dan mengkurasi data, kualitas data cukup akurat dan cocok untuk analisis skala besar dari beberapa aspek komunikasi ilmiah.

Microsoft Academic telah memungkinkan peneliti dan perusahaan komersial untuk bekerja dengan metadata yang komprehensif dengan sedikit biaya

Dengan cara ini, Microsoft Academic telah memungkinkan peneliti dan perusahaan komersial sama-sama bekerja dengan metadata yang komprehensif dengan sedikit biaya. Sebelum Microsoft membuat databasenya tersedia, hanya peneliti di beberapa institut (di negara kaya) yang memiliki akses ke kumpulan data besar, dan perusahaan yang memiliki data semacam itu kebanyakan menggunakannya untuk produk mereka sendiri. Makalah yang memperkenalkan Microsoft Academic Graph telah dikutip lebih dari 500 kali sejak 2015, yang menunjukkan betapa bergunanya database dalam penelitian. Grafik juga digunakan di banyak alat dan layanan komersial dan non-komersial (mis., VOSviewer, Unsub, Litmaps, scite). Dan bahkan ada beberapa database bibliografi dan mesin pencari yang memanfaatkan kekayaan Microsoft Academic (misalnya, Semantic Scholar, The Lens, Scinapse).

Meskipun penutupan Microsoft Academic tidak akan mempengaruhi kinerja alat dan layanan ini dengan cara yang sama, jelas bahwa sumber daya yang berharga akan hilang pada akhir tahun ini. Masih harus dilihat apakah dan bagaimana itu bisa dan akan diganti. Solusi paling murah adalah membayar Microsoft untuk melanjutkan database, yang tentu saja mengharuskan Microsoft untuk tetap menjalankannya. Biaya komputasi awan tahunan untuk memperbarui konten Grafik Akademik Microsoft kira-kira sama dengan gaji seorang ilmuwan data berpengalaman. Seorang pengembang database baru-baru ini memperkirakan bahwa mempertahankan Microsoft Academic pada tingkat teknis saat ini akan menelan biaya sekitar sepertiga dari jumlah yang akan dibayarkan universitas menengah untuk data dari indeks kutipan tradisional.

Menuju infrastruktur penelitian terbuka?

Microsoft Academic telah menunjukkan nilai metadata yang tersedia secara terbuka yang telah dikumpulkan dan dikuratori oleh teknologi AI. Ini telah memberikan lahan subur bagi para peneliti dan perusahaan komersial. Tentu saja ada sumber metadata terbuka lainnya. Misalnya, Crossref berisi lebih dari 125 juta catatan, 48 juta di antaranya memiliki referensi terbuka berkat Initiative for Open Citations dan penerbit yang berkolaborasi. Namun, Crossref lebih kecil, berisi data yang kurang detail, kurang konsisten dikuratori, dan hanya mengindeks publikasi dengan DOI (pengidentifikasi objek digital).

Pada akhirnya, proyek Microsoft telah menunjukkan bahwa tidak cukup hanya membuat database tersedia untuk umum – database juga harus berkelanjutan. Jika kita menginginkan database yang terbuka dan berkelanjutan, mungkin ide yang baik untuk menginvestasikan lebih banyak waktu dan sumber daya dalam membangunnya. Dan untuk memulainya, kami dapat mendukung, misalnya, mereka yang berencana membangun sumber terbuka dan pengganti Microsoft Academic yang bebas digunakan.

  

Catatan: Artikel ini memberikan pandangan penulis, dan bukan posisi blog Dampak Ilmu Sosial, atau London School of Economics. Harap tinjau Kebijakan Komentar kami jika Anda memiliki kekhawatiran tentang memposting komentar di bawah.

Kredit Gambar: Alexandre Debiève melalui Unsplash.

 Aaron Tay

Aaron Tay adalah Lead Data Services di Singapore Management University Libraries. Dia memiliki minat di bidang-bidang seperti sistem penemuan akademik, bibliometrik dan Akses Terbuka dan telah menjalankan blog – Renungan tentang kepustakawanan https://musingsaboutlibrarianship.blogspot.com/ sejak 2009. (ORCID 0000-0003-0159-013X)

 Alberto Martín-Martín

Alberto Martín-Martín adalah peneliti postdoctoral yang bekerja pada bibliometrik dan komunikasi ilmiah di Universidad de Granada, Spanyol.

Sumber: Goodbye, Microsoft Academic – Hello, open research infrastructure? | Impact of Social Sciences (lse.ac.uk)

Tidak ada komentar:

Posting Komentar