گفتوگو با متخصص آمار و جمعآوری اطلاعات درباره سازوکارهای دادهکاوی
دادههایی که پول میشوند
دادهها بهخودی خود ارزشی ندارند، تبدیل این دادهها به اطلاعات، دادهکاوها را در شمار پردرآمدترینها قرار داده است
شبنم سیدمجیدی_روزنامه نگار
حتما برای شما هم پیش آمده که در وبسایتی بهدنبال کالایی باشید و در نهایت 3 کالای دیگر را هم خریداری کنید. در گوشه و کنار صفحه، همیشه گزینههایی نمایش داده میشود که ذهن شما را قلقلک دهد و کاری کند که برای خرید آن کالا دست بهکار شوید. بارها شده صفحه وبسایتی را باز کنید و کالاهایی را در نخستین قدم ببینید که دقیقاً به آنها نیاز دارید. وبسایت از کجا میداند که شما چه چیزی میخواهید؟ این اتفاق با استفاده و تحلیل از دادههایی اتفاق میافتد که شما قبلاً وارد اینترنت کردهاید! دادهکاوی که در دنیا با نام data mining شناخته میشود دنیایی از فرصتهای تجاری را برای کسب و کارها گشوده است. این حوزه از آمار محاسباتی، میلیونها داده را با یکدیگر مقایسه میکند و باعث میشود شرکتها بتوانند رفتار مصرفکننده را پیشبینی کنند. هدف از این کار تولید فرصتهای جدید در بازار است.
فروش اطلاعات، منعی ندارد
دادهکاوی بهخودی خود یکی از پیشروترین و پرتقاضاترین و البته پردرآمدترین مشاغل دنیا محسوب میشود. در گزارش سالانه وبسایت لینکدین(Linked In) که بزرگترین شبکه اجتماعی برای پیداکردن فرصتهای شغلی و گسترش کسب و کارهاست، در مورد شغلهای نوظهور ذکر شده است که 3 مورد از بیشترین تقاضای شغلی در آمریکا مربوط به دادهکاوی بوده است. بنابراین پیشبینی شده که تقاضا برای این نوع مشاغل در سال2020 تا 28درصد رشد کند. اما دادهکاوها دقیقا از چه نوع اطلاعاتی استفاده میکنند، با این اطلاعات چه میکنند و چطور از جمعآوری اطلاعات، درآمد کسب میکنند؟
نیلوفر قاسمی، دادهپرداز و کارشناس در زمینه جمعآوری اطلاعات در اینباره به همشهری میگوید: اگر اطلاعاتی که میخواهید اطلاعات شخصی دیگران نباشد، بهراحتی در دسترس و قابل جمعآوری است. مثلاً در تحقیقات و دادهکاوی در حوزههای پزشکی، مسائلی مثل سن، جنسیت، نوع بیماری، بیماریهای پیش زمینهای و علائم، همان اطلاعات بیمار است که دسترسی به آنها برای محقق منعی ندارد. این اطلاعات کلی است و مشخص نیست مربوط به چه شخصی با چه هویتی است. در نتیجه استفاده از آنها نهتنها بد نیست که باعث پیشرفت علم میشود. او ادامه میدهد: اگر اطلاعات، حیاتی یا شخصی باشد، نمیتوانیم از آنها استفاده کنیم و اجازه دسترسی و فروش آنها را نداریم. فقط میتوانیم روی اطلاعات در دسترس پردازش انجام دهیم و آنها را به دادههای خام تبدیل کنیم و در نهایت اطلاعات دیگری را از این دادههای خام، نتیجهگیری کنیم. این اطلاعات نهایی، قابلیت فروش دارد. دادههای خام که بهصورت عدد و کلمه درآمدهاند بهخودی خود معنایی ندارند، باید به آنها چیزهایی اضافه شود تا تبدیل به اطلاعات شود. بعد میتوانیم این اطلاعات را به کسی که به آنها نیاز دارد، بفروشیم. فروش اطلاعاتی که از دادههایی که در دسترس عموم قرار دارد، بهدست آمده، به هیچوجه منعی ندارد.
اما آیا وبسایتهایی که اطلاعات کاربران را در اختیار دیگر افراد قرار میدهند، کاری قانونی انجام میدهند؟ به گفته قاسمی، اطلاعاتی که خود کاربران در وبسایتها و اپلیکیشنها وارد میکنند، اگر مورد پردازش قرار گیرد و از آنها برای فروش و تبیلغات استفاده شود، منعی ندارد؛ «اصل موضوع دادهکاوی در تجارت، همین است. سیستمهای پیشنهاددهندهای وجود دارند که با توجه به سلایق مشتری و انتخابهایی که قبلاً در وبسایت داشته، به او پیشنهادهای جدیدی میدهند. مثلا سایت IMDB را درنظر بگیرید. با توجه به فیلمهایی که قبلاً دیده و در سایت انتخاب کردهاید، فیلمهای جدیدی برای تماشا به شما پیشنهاد میدهد. شرکتهای دیگر مثل فروشگاههای آنلاین اطلاعات کاربران را برای خودشان استفاده میکنند و بعید است این اطلاعات را به شرکتها یا افراد دیگر بفروشند؛ چرا که باعث ضرر خودشان میشود. اطلاعات شخصی و محرمانهای که گاهی درز میکند، توسط هکرها دزدیده میشود و کاری غیراخلاقی و غیرقانونی است.»
تحلیل دادهها، دلیل پیشتازی کسب و کارهای مطرح
علی نوری، متخصص آمار و تحلیلگر علم داده نیز با بیان اینکه دادهکاوی در حوزههای مختلف کاربرد دارد، میگوید: در ایران از این علم بیشتر در حوزه تحقیقات و کمک به جامعه علمی کشور استفاده میشود. مثلاً یک تحقیق اقتصادی به دادههایی مثل نرخ ارز، قیمت نفت، نرخ تورم، نرخ رشد اقتصادی و.. نیاز دارد. این اطلاعات را بهراحتی میتوان جمعآوری کرد و از آنها به نتیجه رسید. اما تحقیقاتی وجود دارد که دسترسی به اطلاعات آن سختتر است. شرکتهای خصوصی مثل شرکتهای دارویی، نفتی یا خودروسازی به دادههای خاصی نیاز دارند، مثلا داراییهای خود را به شکل سال به سال بررسی میکنند. جمعآوری دادههای بزرگ زمانبر است و در نتیجه برای اینکه در موعد مقرر به خواسته خود برسند، باید از دادهکاو و محقق استفاده کنند.
شرکتهایی مثل دیجیکالا، اسنپ و دیوار در دادهکاوی خیلی خوب جلو رفتهاند. آنها به خوبی از روباتهای دادهکاوی و افراد متخصص این رشته استفاده میکنند. همین تحلیلگران باعث پیشتازی این شرکتها از شرکتهای رقیب شده است. آنها با دادهکاوی میفهمند مشتری چه میخواهد و همان را به او ارائه میکنند.
نوری میگوید: بعضی از تحقیقات داده در حوزه وب انجام میشود. مثلاً یک کاربر واژهای یا جملهای را جستوجو میکند. با استفاده از ابزارها و تحلیلهایی میتوان به دیگر علایق او پی برد و یا بر همین اساس میتوان فهمید در یکماه اخیر دغدغه مردم ایران چه بوده است و دنبال چه چیزی بودهاند. فردی که بخواهد کسب و کاری را شروع کند، براساس این اطلاعات میتواند بفهمد چطور کسب و کار خود را گسترش دهد. نرمافزارها یا روباتهایی وجود دارند که در سایتها قرار میگیرند و فعالیتهای کاربران را رصد میکنند. موتور جستوجوی گوگل نیز چنین رصدهایی دارد. وبسایتها میتوانند بر این اساس تصمیمات بهتری بگیرند. مثلا وبسایتی 50 صفحه دارد و با دادهکاوی میتواند بفهمد ارزش کدام صفحه از همه بیشتر است. یا مثلا براساس دادههای بهدستآمده بتوانید راهحلهایی بیابید تا بازدیدهای سایت خود را افزایش دهید.
فروش دغدغههای مردم به شرکتها
اگر اطلاعات در جهت خوبی بهکار گرفته شود، نتایج مثبتی دارد. مثلاً دادهکاوی و علم آمار مشخص میکند مردم در یکماه اخیر نیازمند چه نوع ماسکی بودهاند. در نتیجه میتوان میزان تولید آن ماسک را بالا برد که در نهایت به نفع همه است. اما در مواردی هم دیده شده که از اطلاعات افراد استفادههای نادرستی شده است. نوری با بیان اینکه انتشار اسم و اطلاعات شخصی افراد و فروختن آنها اشکال دارد، میگوید: اطلاعاتی مثل شماره تلفن افراد، محل سکونت، نام و نام خانوادگی و... درست نیست. مثلا وقتی بعضی مدارس چنین اطلاعاتی از دانشآموزان را به آموزشگاههای کنکور میفروختند، از نظر اخلاقی اشکال داشت. اما اگر همان مدارس بیایند نوع دیگری از اطلاعات را منتشر کنند، مثلا بگویند 50درصد دانشآموزان دغدغه یادگیری ریاضیات دارند و گزارشی راجع به وضعیت تحصیلی دانشآموزان ارائه کنند و حتی این اطلاعات را به آموزشگاهها بفروشند، مشکلی ندارد چون در نهایت این اطلاعات به کسب و کار مورد نظر (در اینجا منظورمان آموزشگاه کنکور است) کمک میکند تا دغدغههای دانشآموزان را رفع کند. بهطور کلی جمعآوری و پردازش و انتشار اطلاعات به رشد کسب و کارها و رشد علمی کمک میکند و به نفع مردم است. اگر این اطلاعات در جهت خوبی بهکار گرفته شود، نتایج مثبتی دارد.
او درباره درآمدزایی این حوزه نیز میگوید: در موضوع داده و دیتا، اگر توانایی بهدستآوردن اطلاعات مورد نیاز را داشته باشید و اگر اطلاعات شما بیش از بقیه باشد، بهراحتی میتوانید به درآمد مالی هم برسید. تخصصهای لازم در این زمینه مورد نیاز است، مثلا در حوزه بورس باید تخصص استخراج دادهها و تبدیلهای خاص آن را داشته باشید. در نهایت موارد را کنار هم بگذارید و به یک تحلیل منطقی و درست از روند دادهها دست یابید. اگر همه مسیر را درست بروید، پیشبینیهای خوبی خواهید داشت که دقیقاً همان اطلاعاتی است که خریدار دارد و مسلماً درآمدزایی خوبی برای شما خواهد داشت.