• پنج شنبه 6 اردیبهشت 1403
  • الْخَمِيس 16 شوال 1445
  • 2024 Apr 25
دو شنبه 30 تیر 1399
کد مطلب : 105322
+
-

گفت‌وگو با متخصص آمار و جمع‌آوری اطلاعات درباره سازوکارهای داده‌کاوی

داده‌هایی که پول می‌شوند

داده‌ها به‌خودی خود ارزشی ندارند، تبدیل این داده‌ها به اطلاعات، داده‌کاوها را در شمار پردرآمدترین‌ها قرار داده است

داده‌هایی که پول می‌شوند

شبنم سیدمجیدی_روزنامه نگار

حتما برای شما هم پیش آمده که در وب‌سایتی به‌دنبال کالایی باشید و در نهایت 3 کالای دیگر را هم خریداری کنید. در گوشه و کنار صفحه، همیشه گزینه‌هایی نمایش داده می‌شود که ذهن شما را قلقلک دهد و کاری کند که برای خرید آن کالا دست به‌کار شوید. بارها شده صفحه وب‌سایتی را باز کنید و کالاهایی را در نخستین قدم ببینید که دقیقاً به آنها نیاز دارید. وب‌سایت از کجا می‌داند که شما چه چیزی می‌خواهید؟ این اتفاق با استفاده و تحلیل از  داده‌هایی اتفاق می‌افتد که شما قبلاً وارد اینترنت کرده‌اید! داده‌کاوی که در دنیا با نام data mining شناخته می‌شود دنیایی از فرصت‌های تجاری را برای کسب و کارها گشوده است. این حوزه از آمار محاسباتی، میلیون‌ها داده را با یکدیگر مقایسه می‌کند و باعث می‌شود شرکت‌ها بتوانند رفتار مصرف‌کننده را پیش‌بینی کنند. هدف از این کار تولید فرصت‌های جدید در بازار است.

فروش اطلاعات، منعی ندارد
 داده‌کاوی به‌خودی خود یکی از پیشروترین و پرتقاضا‌ترین و البته پردرآمدترین مشاغل دنیا محسوب می‌شود. در گزارش سالانه وب‌سایت لینکدین(Linked In) که بزرگ‌ترین شبکه اجتماعی برای پیداکردن فرصت‌های شغلی و گسترش کسب و کارهاست، در مورد شغل‌های نوظهور ذکر شده است که 3 مورد از بیشترین تقاضای شغلی در آمریکا مربوط به داده‌کاوی بوده است. بنابراین پیش‌بینی شده که تقاضا برای این نوع مشاغل در سال2020 تا 28درصد رشد کند. اما داده‌کاوها دقیقا از چه نوع اطلاعاتی استفاده می‌کنند، با این اطلاعات چه می‌کنند و چطور از جمع‌آوری اطلاعات، درآمد کسب می‌کنند؟
نیلوفر قاسمی، داده‌پرداز و کارشناس در زمینه جمع‌آوری اطلاعات در این‌باره به همشهری می‌گوید: اگر اطلاعاتی که می‌خواهید اطلاعات شخصی دیگران نباشد، به‌راحتی در دسترس و قابل جمع‌آوری است. مثلاً در تحقیقات و داده‌کاوی در حوزه‌های پزشکی، مسائلی مثل سن، جنسیت، نوع بیماری، بیماری‌های پیش زمینه‌ای و علائم، همان اطلاعات بیمار است که دسترسی به آنها برای محقق منعی ندارد. این اطلاعات کلی است و مشخص نیست مربوط به چه شخصی با چه هویتی است. در نتیجه استفاده از آنها نه‌تنها بد نیست که باعث پیشرفت علم می‌شود. او ادامه می‌دهد: اگر اطلاعات، حیاتی یا شخصی باشد، نمی‌توانیم از آنها استفاده کنیم و اجازه دسترسی و فروش آنها را نداریم. فقط می‌توانیم روی اطلاعات در دسترس پردازش انجام دهیم و آنها را به داده‌های خام تبدیل کنیم و در نهایت اطلاعات دیگری را از این داده‌های خام، نتیجه‌گیری کنیم. این اطلاعات نهایی، قابلیت فروش دارد. داده‌های خام که به‌صورت عدد و کلمه درآمده‌اند به‌خودی خود معنایی ندارند، باید به آنها چیزهایی اضافه شود تا تبدیل به اطلاعات شود. بعد می‌توانیم این اطلاعات را به کسی که به آنها نیاز دارد، بفروشیم. فروش اطلاعاتی که از داده‌هایی که در دسترس عموم قرار دارد، به‌دست آمده، به هیچ‌وجه منعی ندارد.
اما آیا وب‌سایت‌هایی که اطلاعات کاربران را در اختیار دیگر افراد قرار می‌دهند، کاری قانونی انجام می‌دهند؟ به گفته قاسمی، اطلاعاتی که خود کاربران در وب‌سایت‌ها و اپلیکیشن‌ها وارد می‌کنند، اگر مورد پردازش قرار گیرد و از آنها برای فروش و تبیلغات استفاده شود، منعی ندارد؛ «اصل موضوع داده‌کاوی در تجارت، همین است. سیستم‌های پیشنهاددهنده‌ای وجود دارند که با توجه به سلایق مشتری و انتخاب‌هایی که قبلاً در وب‌سایت داشته، به او پیشنهادهای جدیدی می‌دهند. مثلا سایت IMDB را درنظر بگیرید. با توجه به فیلم‌هایی که قبلاً دیده و در سایت انتخاب کرده‌اید، فیلم‌های جدیدی برای تماشا به شما پیشنهاد می‌دهد. شرکت‌های دیگر مثل فروشگاه‌های آنلاین اطلاعات کاربران را برای خودشان استفاده می‌کنند و بعید است این اطلاعات را به شرکت‌ها یا افراد دیگر بفروشند؛ چرا که باعث ضرر خودشان می‌شود. اطلاعات شخصی و محرمانه‌ای که گاهی درز می‌کند، توسط هکرها دزدیده می‌شود و کاری غیراخلاقی و غیرقانونی است.»

تحلیل داده‌ها، دلیل پیشتازی کسب و کارهای مطرح
علی نوری، متخصص آمار و تحلیلگر علم داده نیز با بیان اینکه داده‌کاوی در حوزه‌های مختلف کاربرد دارد، می‌گوید: در ایران از این علم بیشتر در حوزه تحقیقات و کمک به جامعه علمی کشور استفاده می‌شود. مثلاً یک تحقیق اقتصادی به داده‌هایی مثل نرخ ارز، قیمت نفت، نرخ تورم، نرخ رشد اقتصادی و.. نیاز دارد. این اطلاعات را به‌راحتی می‌توان جمع‌آوری کرد و از آنها به نتیجه رسید. اما تحقیقاتی وجود دارد که دسترسی به اطلاعات آن سخت‌تر است. شرکت‌های خصوصی مثل شرکت‌های دارویی، نفتی یا خودروسازی به داده‌های خاصی نیاز دارند، مثلا دارایی‌های خود را به شکل سال به سال بررسی می‌کنند. جمع‌آوری داده‌های بزرگ زمانبر است و در نتیجه برای اینکه در موعد مقرر به خواسته خود برسند، باید از داده‌کاو و محقق استفاده کنند.
شرکت‌هایی مثل دیجی‌کالا، اسنپ و دیوار در داده‌کاوی خیلی خوب جلو رفته‌اند. آنها به خوبی از روبات‌های داده‌کاوی و افراد متخصص این رشته استفاده می‌کنند. همین تحلیلگران باعث پیشتازی این شرکت‌ها از شرکت‌های رقیب شده است. آنها با داده‌کاوی می‌فهمند مشتری چه می‌خواهد و همان را به او ارائه می‌کنند.
نوری می‌گوید: بعضی از تحقیقات داده در حوزه وب انجام می‌شود. مثلاً یک کاربر واژه‌ای یا جمله‌ای را جست‌وجو می‌کند. با استفاده از ابزارها و تحلیل‌هایی می‌توان به دیگر علایق او پی برد و یا بر همین اساس می‌توان فهمید در یک‌ماه اخیر دغدغه مردم ایران چه بوده است و دنبال چه چیزی بوده‌اند. فردی که بخواهد کسب و کاری را شروع کند، براساس این اطلاعات می‌تواند بفهمد چطور کسب و کار خود را گسترش دهد. نرم‌افزارها یا روبات‌هایی وجود دارند که در سایت‌ها قرار می‌گیرند و فعالیت‌های کاربران را رصد می‌کنند. موتور جست‌و‌جوی گوگل نیز چنین رصدهایی دارد. وب‌سایت‌ها می‌توانند بر این اساس تصمیمات بهتری بگیرند. مثلا وب‌سایتی 50 صفحه دارد و با داده‌کاوی می‌تواند بفهمد ارزش کدام صفحه از همه بیشتر است. یا مثلا براساس داده‌های به‌دست‌آمده بتوانید راه‌حل‌هایی بیابید تا بازدیدهای سایت خود را افزایش دهید.

فروش دغدغه‌های مردم به شرکت‌ها
اگر اطلاعات در جهت خوبی به‌کار گرفته شود، نتایج مثبتی دارد. مثلاً داده‌کاوی و علم آمار مشخص می‌کند مردم در یک‌ماه اخیر نیازمند چه نوع ماسکی بوده‌اند. در نتیجه می‌توان میزان تولید آن ماسک را بالا برد که در نهایت به نفع همه است. اما در مواردی هم دیده شده که از اطلاعات افراد استفاده‌های نادرستی شده است. نوری با بیان اینکه انتشار اسم و اطلاعات شخصی افراد و فروختن آنها اشکال دارد، می‌گوید: اطلاعاتی مثل شماره تلفن افراد، محل سکونت، نام و نام خانوادگی و... درست نیست. مثلا وقتی بعضی مدارس چنین اطلاعاتی از دانش‌آموزان را به آموزشگاه‌های کنکور می‌فروختند، از نظر اخلاقی اشکال داشت. اما اگر همان مدارس بیایند نوع دیگری از اطلاعات را منتشر کنند، مثلا بگویند 50درصد دانش‌آموزان دغدغه یادگیری ریاضیات دارند و گزارشی راجع به وضعیت تحصیلی دانش‌آموزان ارائه کنند و حتی این اطلاعات را به آموزشگاه‌ها بفروشند، مشکلی ندارد چون در نهایت این اطلاعات به کسب و کار مورد نظر (در اینجا منظورمان آموزشگاه کنکور است) کمک می‌کند تا دغدغه‌های دانش‌آموزان را رفع کند. به‌طور کلی جمع‌آوری و پردازش و انتشار اطلاعات به رشد کسب و کارها و رشد علمی کمک می‌کند و به نفع مردم است. اگر این اطلاعات در جهت خوبی به‌کار گرفته شود، نتایج مثبتی دارد.
او درباره درآمدزایی این حوزه نیز می‌گوید: در موضوع داده و دیتا، اگر توانایی به‌دست‌آوردن اطلاعات مورد نیاز را داشته باشید و اگر اطلاعات شما بیش از بقیه باشد، به‌راحتی می‌توانید به درآمد مالی هم برسید. تخصص‌های لازم در این زمینه مورد نیاز است، مثلا در حوزه بورس باید تخصص استخراج داده‌ها و تبدیل‌های خاص آن را داشته باشید. در نهایت موارد را کنار هم بگذارید و به یک تحلیل منطقی و درست از روند داده‌ها دست یابید. اگر همه مسیر را درست بروید، پیش‌بینی‌های خوبی خواهید داشت که دقیقاً همان اطلاعاتی است که خریدار دارد و مسلماً درآمدزایی خوبی برای شما خواهد داشت.

این خبر را به اشتراک بگذارید