大数据时代的数据管理系统峰会在清华大学召开
时间:2014-09-04浏览: 次
通讯员:龙明盛
2014年8月29-30日,由清华大学数据科学研究院主办、清华大学软件学院和IBM中国研究院联合承办的“大数据时代的数据管理系统峰会(Modern Data Mana-gement System Summit)”在清华大学FIT楼成功召开。
图为参会中外专家进行闭门讨论,清华大学清华信息科学与技术国家实验室主任、信息学院院长孙家广院士主持会议。
本次峰会由美国国家工程院院士、IBM首席科学家C. Mohan博士和中国工程院院士、清华大学信息学院院长孙家广教授担任大会主席,清华大学校长助理杨斌教授出席峰会并致开幕辞。大数据管理与分析领域国际顶级科学家和国内知名教授,中国装备制造、汽车、通信、气象、文化服务等行业信息化专家,以及工信部、科技部和国家自然科学基金委相关领导齐聚一堂,共同解析了现代数据管理系统的关键理论和技术,并从学术研究和产业应用的角度透视了大数据和数据科学的未来发展脉络。大会由清华大学软件学院党委书记王建民教授和IBM中国研究院副院长陆薇博士共同主持。
图为清华大学校长助理杨斌教授致开幕辞,清华大学软件学院党委书记王建民教授主持会议。
在峰会的开始,大会主席C. Mohan院士作了题为“信息管理的现状与未来”主题报告,以大数据时代信息管理与处理所面临的问题和挑战为背景,总结了当前纷繁杂乱的开源、商业性或研究性大数据管理系统(SQL、NoSQL、NewSQL)的优势与局限,并站到领域前沿,高屋建瓴地探讨了大数据管理的理论、技术与系统在未来十年的发展方向。
图为美国国家工程院院士C. Mohan博士作题为“信息管理的现状与未来”主题报告。
接下来,十位大数据管理与分析领域的顶级科学家和参会学者一起分享了他们在大数据理论、技术与应用方面的研究成果。密歇根大学软件系统实验室主任、VLDB超大型数据库会议主编H. V. Jagadish教授以独特的视角阐述了大数据和数据科学的含义,以及在数据可用性方面的前瞻性探索。新加坡国立大学总统奖获得者Beng Chin Ooi教授展示了自主研发的分布式多模型计算框架epiC和深度学习框架LAPIS。滑铁卢大学计算机系教授M. Tamer ?zsu讲解了如何利用资源描述框架来对互联网数据进行有效管理。微软研究院首席科学家Paul Larson以微软SQL Server数据库为例,给大家分析了如何在现代计算机硬件设施上改进关系型数据库的体系结构。加州大学欧文分校教授Sharad Mehrotra讲述了在数据管理系统应急响应技术方面的研究成果。IBM研究院Yunyao Li博士讲解了将声明式语言和信息抽取、数据分析、机器学习算法结合起来,组建用户友好、可解释好的大数据分析引擎。加州大学圣芭芭拉分校计算机系教授Amr El Abbadi分享了团队在数据管理、数据挖掘和分布式系统方向上的最新研究进展。卡塔尔计算研究中心的首席科学家Ashraf Aboulnaga展示了他们研发的易擦除、可用性高的分布式数据库系统。苏黎世联邦理工学院计算机系教授Gustavo Alonso回顾了可定制系统的发展历史,分析其演进趋势,同时探讨了可定制系统给现代软件系统与工程研究带来的机遇和挑战。
密西根大学软件系统实验室主任H. V. Jagadish作题为“数据科学、大数据与数据可用性”特邀报告。
在峰会最后,来自斯坦福大学InfoLab实验室的Christopher Ré教授给大家展示了InfoLab在社交网络、数据挖掘、分布式计算系统等领域的最新研究成果,重点阐述了被福布斯评为数据科学顶级工具的DeepDive和并行计算效率提升百倍的统计优化框架DimmWitted。Christopher完美精湛的科研成果和行云流水般的演讲风格给峰会划下了完美的句号。
图为斯坦福大学Christopher Ré教授作题为“数据驱动的研究在斯坦福信息实验室”特邀报告。
本次峰会邀请了北京大学、人民大学、复旦大学、西北工业大学和中国科学院等科研单位的知名教授,以及三一重工、上汽集团、万达集团、中国移动、中国气象局等企事业单位的资深专家共同参与会议讨论,来自国内多家单位的180余名教师和研究生听取了12个大会特邀报告。本次峰会的详细信息参见峰会网址:http://ise.thss.tsinghua.edu.cn/MDMS。
图为峰会现场。