اوایل دیماه هرسال، دانشجویان و استادان ایرانیِ خارج از کشور برای تعطیلات سال نوِ میلادی به ایران سفری کوتاه دارند. شاخهی دانشجویی ACM دانشگاه تهران، با استفاده از این فرصت در سه روز متوالی میزبانِ سه سخنران بود.
هریک از این سخنرانی با حضور ۳۰-۴۰ دانشجو برگزار شد.
۱- عادل اردلان: دانشجوی دکتری علوم کامپیوتر، دانشگاه ویسکانیسن-مدیسن
زمان برگزاری: ۶ دیماه ۱۳۹۳
موضوع سخنرانی: گذری بر نظیریابی در دادههای بزرگ
چکیدهی سخنرانی:
روزی روزگاری، عمدهی دادههای دنیا، ساختیافته بودند. مدلهای گوناگون پایگاهی، از سلسلهمراتبی و شبکهای تا مدل رابطهای، برای مدیریت و استخراج اطلاعات ابداع شده و مورد بهرهبرداری قرار گرفتهاند. در سالها و دهههای اخیر، اما، عمدهی دادههای تولیدشده، خصوصا در فضای وب، غیرساختیافته و نیمهساختیافته هستند. دادههای مربوط به موضوعات یکسان یا مرتبط، در قالبهای متفاوت و گوناگونی عرضه میشوند (مانند صفحات HTML و متون زبان طبیعی)، و حاوی مقادیر قابل ملاحظهای نویز هستند. از همین رو، تجمیع این دادهها در قالب یک مدل دادهای یکپارچه ، از جهت ارتقاء کیفیت دادهها، مدیریت حجم آنها و امکان اعمال روشهای گوناگون استخراج اطلاعات و دانش، حائز اهمیت است. روشهای نوین تجمیع دادهها (Data Integration) باید امکان یکنواختسازی حجم بسیار زیادی از دادهها را با کیفیت بالا، در زمان قابلقبول و باکمترین میزان دخالت عامل انسانی فراهم آورند.
۲- حسین اخلاقپور: با ۱۸ سال سابقهی هدایتِ پروژههای نرمافزارهای سازمانی (enterprise) در حوزههای مالی، تجارت الکترونیک و سلامت که همکاری با شرکتهایی همچون ebay، Visa، CNet و Velti دارد. حسین اخلاقپور هماکنون مدیر پروژه در یک استارتاپ با نام جِنَپسیس است که بر روی طراحی و توسعهی CMOS بر پایهی توالی DNAها است.
زمان برگزاری: ۷ دیماه ۱۳۹۳
موضوع سخنرانی: بیتکوین و یادگیری عمیق، دو عنصر عصر دادهمحور (Data-Driven era)
چکیدهی سخنرانی:
امروز در صنایع مختلف، گرایش زیادی به تکیهکردن بر دادههای موجود برای تصمیمگیری وجود دارد. در این زمینه استفاده از دادهها در مقابل استفاده از متخصصان و شهود قرار میگیرد. مدل اگهیهای تبلیغاتی نقش مهمی در تولد دادههای بزرگ در این صنایع دارد.
پولهای مجازی مانند بیتکوین، را میتوان تنها راهِحل ارزشمند و قابل اطمینان برای ایجاد یک محیط تجاری هیجانانگیز و در ضمن امن (حافظ حریم شخصی افراد) دانست. به طور همزمان در این دوره، با گسترش استفاده از دادههای بزرگ، از یادگیری عمیق به عنوان بهترین گزینه برای بررسی دادههای بزرگ، تصمیمگیریهای مهم، تشخیصهای پزشکی، مدیریتِ بحران و کاربردهای بسیار دیگری نام برده میشود.
۳- علی وکیلیان: دانشجوی دکتری علوم کامپیوتر دانشگاه MIT
موضوع سخنرانی: الگوریتم استرمینگ (و پروتکل ارتباطی) برای مسئله پوشش یک مجموعه (Set Cover Problem)
چکیدهی سخنرانی:
در این سخنرانی آقای علی وکیلیان، در مورد روشی که به تازگی در یک کار تحقیقاتی ارائه دادهاند، توضیحاتی ارائه کردند. [Erik Demaine, Piotr Indyk, Sepideh Mahabadi, Ali Vakilian. DISC 2014.]
اولین الگوریتم استرمینگ و اولین پروتکل ارتباطی دو طرفه که در آن از تعداد ثابتی گذر و فضای زیرخطی برای تخمین لگاریتمی مسألهی کلاسیک پوشش یک مجموعه استفاده میکند را توسعه دادهایم. به طور خاص برای n عضو و m مجموعه، الگوریتم ما فضای محدود (O(m ·n δ log2n logm را با استفاده از ( O(41/δ گذر به دست میآورد این در حالی است که تخمینی از مرتبه (O(41/δ logn در زمان چندجملهای را برای هر δ>0 به دست میآورد. روش ما از خاصیت تصادفی استفاده میکند که نشان میدهیم این این کار ضروری است. به عبارت دیگر هیچ تخمین ثابت و معین حتی با زمان نمایی و در فضای (O(mn امکانپذیر نیست. این موارد بعضی از نتایج اولین الگوریتم استرمینگ و پروتکل ارتباطی دو طرفهی بهینه برای الگوریتمهای تخمین میباشد. در پایان، به نتایج حاصل از این کار اشاره شد.