应用机器学习logistics方法进行数据分析
2022年4月19日19:00,数据科学与大数据技术专业2021级学生在西校区27A-501收看了本学期第一场线上学术讲座,讲座由专业共建企业中国高科集团资深工程师张然主讲“应用机器学习logistics方法进行数据分析”。
张然老师介绍机器学习是人工智能常用方法,主要用于数值预测和分类。两种方法的本质都是通过对已有数据的学习,构建模型,然后对未知的数据进行预测,若是连续的数值预测就是回归问题,若是离散的类标号预测,就是分类问题。数值预测一般用回归模型,最常用的线性回归,分类预测的方法有很多,比如决策树,KNN ,支持向量机,朴素贝叶斯等。
张老师着重介绍了分类算法中的逻辑回归(logistic regression )算法。Logistic Regression因其算法简单高效,常用于广告点击预测、垃圾邮件识别、医疗疾病诊断、金融诈骗预测、虚拟账号捕捉等应用领域。以癌症分类预测为例,在Python环境下进行了代码验证。
此次讲座,同学们对传说中的“机器学习”有了更深入的了解,更加明确了自己的专业学习方法。