中国计算机学会(CCF)青年计算机论坛——数据科学:理论与应用
时间:2017-9-1 12:15:54   阅读:   标签: 计算机学院 数据科学 中国计算机学会 青年计算机论坛
数据科学:理论与应用 报告会
中国计算机学会 哈尔滨分部
ACM SIGMOD China
ACM Harbin Chapter
中国计算机学会 青年计算机论坛(CCF YOCSEF)哈尔滨
201791(星期五) 14:00-17:00
在哈尔滨工业大学新技术楼618房间举行
 
议程安排
14:00          签到
14:30             活动开始
14:30-14:35    开场白
14:35-16:00 于丹彤副教授 美国新泽西理工大学
Big Data Co-Design:  Theory, Applications, and Potentials
报告摘要“Big data” from science experiments, business market, corporates, consumers, and social networks post significant challenges of Variety, Volume, and Velocity (3-Vs) in the fields of high performance computing, data management, data mining, and knowledge discovery.  To cope with these challenges, a holistic approach must be co-designed from the top-level application-driven knowledge discovery to the low-level data analysis modules, high performance computing, and data management. In this talk, I will primarily focus on the algorithmic design for data mining and knowledge discovery, and data mining application in the fields of life science and computational biology.
I will present innovative tools of multi-scale hierarchical data modeling, global pattern (clustering) and local pattern (outliers) detection, and innovative feature selections. One powerful computational tool is the partial-differential-equation-enabled (PDE) spectral analysis paradigm for data modeling, analysis, and feature selection.  With the help of PDE-based heat diffusion theory, we can construct multi-scale/multi-resolution structures on continuous learning manifolds or discrete graphs.  The advantage of this approach is that it combines both the topological information of the model and the multi-scale property of scattered data together to uncover features and reveal intrinsic interactions at different scales. The second part of my talk focuses on using the Granger causality (GC) model to discover gene regulatory networks from time series gene expression data.  I will present our innovative algorithm, CGC-2SPR (Conditional Granger Causality using two-step prior Ridge regularization) that uses powerful regularization strategies and incorporates prior knowledge of biological network to mitigate the complexity of data and predict the gene relationship with high accuracy. 
I will discuss the direct applications of my big data research in improving business intelligence (for example, financial market and stock time series analysis) and facilitating risk analysis and business planning.
16:00-17:00  主题讨论:大数据的理论与应用
 
报告会主席:王宏志 (哈尔滨工业大学教授、博士生导师)
参加人员:IT领域专业人士、高校教师和学生、媒体、其他有兴趣者
 
报告会地点如下所示


特邀讲者
于丹彤,副教授,美国纽约州立大学布法罗分校计算机科学专业博士,美国新泽西理工大学终身教授,美国能源部直属布鲁克海文国家实验室客座科学家,机器学习和数据挖掘杰出学者。在IEEE TKDE, ACM TKDD, ICDM, and CIKM 等顶级国际期刊和权威国际会议上发表学术论文70 余篇,论文总引用数超过1000 次。
 
执行主席
王宏志,哈尔滨工业大学计算机科学与技术学院教授、博士生导师。其研究方向为大数据管理、数据质量、图数据管理。发表学术论文150余篇,出版学术专著两本,出版国内首部《大数据算法》教材,其论文被SCI检索29次,EI检索100余次,他引500余次,其中7篇论文发表于顶级国际会议上。获得微软学者、中国优秀数据库工程师、IBM博士英才等称号,“海量数据计算的理论和技术”获得黑龙江省自然科学一等奖,其博士论文获得哈尔滨工业大学优秀博士论文和中国计算机学会优秀博士论文。先后主持国家自然科学基金重点项目、国家支撑计划课题、国家博士后特别资助等10等项目,还参加国家973项目、863项目、自然科学基金重点项目等多个项目。他担任4个国际期刊的编委,并30余次担任国内外多个知名数据库会议程序委员会委员。现任CCF哈尔滨分部秘书长,ACM SIGMOD China秘书长,中国计算机学会学术工作委员会委员,2014年-2015年任CCF YOCSEF哈尔滨分论坛主席,CCF高级会员,中国数据库专业委员会常务委员,中国大数据专家委员会通信委员,中国计算机应用专业委员会委员,ACM SIGCSE委员。

 

 
发布:孟晓辉 |  审核:李岳 |  来源: 计算机学院