গুগলের আড়াই কোটি ডাটাসেট উন্মুক্ত

ইন্টারনেটে ‘ডেটাসেট সার্চ’ নামের প্রায় দুই কোটি ৫০ লাখ ডেটাসেট ব্যবহারের জন্য উন্মুক্ত করে দিলো বিশ্বখ্যাত সার্চ ইঞ্জিন গুগল। উন্মুক্ত করা ডেটাসেটগুলো ব্যবহার উপযোগী ফরম্যাটে পাওয়া যাচ্ছে।

সম্প্রতি গুগলের রিসার্চ বিভাগের রিসার্চ সায়েন্টিস্ট নাতাশা নও এক ব্লগ পোস্টে জানান, পুরো ওয়েব দুনিয়ায় রয়েছে লক্ষাধিক ডেটাসেট। এর মধ্যে ব্যবহারকারীদের নানান বিষয়ে আগ্রহ দেখা যায়। তাদের বহুমাত্রিক পছন্দের কথা ভেবেই গুগল এসব ডেটাসেট বিনামূল্যে ব্যবহারের জন্য উন্মুক্ত করে দিয়েছে। 

ডেটাসেটের মধ্যে বিভিন্ন সরকারি ও গবেষণা প্রতিষ্ঠানের ডেটা যেমন রয়েছে, তেমনই ব্যবহারকারীদের কাজে লাগে এমন ডেটাও রাখা হয়েছে।

নাতাশা বলেন, “আমাদের দীর্ঘদিনের গবেষণায় দেখেছি, ব্যবহারকারীরা এখন বিভিন্ন ধরনের ডেটা চায়। শিক্ষা প্রতিষ্ঠানে গবেষণা, শিক্ষার্থীদের পড়াশোনার কাজে ব্যবহার, বিজনেস অ্যানালাইসিস এবং ডেটা সায়েন্টিস্টদের জন্য ডেটা প্রয়োজন। বেশিরভাগ ক্ষেত্রেই দেখেছি ‘শিক্ষা’, ‘আবহাওয়া’, ‘ক্যান্সার’, ‘অপরাধ’, ‘সকার’ ও ‘কুকুর’ বিষয়ে ডেটা খুঁজে থাকেন অনেকেই।”

সামাজিক যোগাযোগমাধ্যম ফেসবুকের ডেটা সায়েন্টিস্ট টম ওয়াটারম্যান গুগলের উন্মুক্ত ডেটাসেট প্রসঙ্গে বলেন, ‘উদ্যোগটি বেশ ভালো। আমি ব্যক্তিগতভাবে ডেটাসেট সার্চ করে দেখেছি, এর মধ্যে অর্ধেকই ফর-প্রফিট কাজে ব্যবহৃত করার জন্য রয়েছে। বাজার সম্পর্কিত ডেটাসেটও রয়েছে এই তালিকায়।’

গুগলের তথ্যানুযায়ী, ডেটাসেটে তিন ধরনের ডেটার প্রাধান্য রয়েছে। এর মধ্যে উল্লেখযোগ্য ‘জিয়োসায়েন্স’, ‘বায়োলজি’ ও ‘এগ্রিকালচার’। বর্তমানে ডেটাসেট ব্যবহারের জন্য গুগল আলাদা কোনো এপিআই দিচ্ছে না।

স্কিমা ডট অর্গ ব্যবহারের মাধ্যমে চাইলে কেউ ওপেন স্ট্যান্ডার্ডে ডেটাসেট সার্চে এটি উন্মুক্ত করতে পারবেন। শুরুতে বেটা সংস্করণ চালু হলেও শিগগিরই পূর্ণাঙ্গভাবে ডেটাসেট উন্মুক্ত হবে বলে জানা গেছে।

আগ্রহীরা সরাসরি https://datasetsearch.research.google.com ঠিকানায় গিয়েই পাবেন ডেটাসেটগুলো।

গুগলের ডেটাসেট থেকে ফিল্টারের মাধ্যমে আলাদাভাবে টেবিল, ইমেজ ও টেক্সট বের করার সুযোগ রয়েছে। পুরো ডেটাসেটেই ওপেন স্ট্যান্ডার্ড নীতিমালা অনুসরণ করা হয়েছে।

সাম্প্রতিক দেশকাল ইউটিউব চ্যানেল সাবস্ক্রাইব করুন

মন্তব্য করুন

Epaper

সাপ্তাহিক সাম্প্রতিক দেশকাল ই-পেপার পড়তে ক্লিক করুন

Logo

ঠিকানা: ১০/২২ ইকবাল রোড, ব্লক এ, মোহাম্মদপুর, ঢাকা-১২০৭

© 2024 Shampratik Deshkal All Rights Reserved. Design & Developed By Root Soft Bangladesh

// //