
概率论是统计学的基础,统计学冲锋在应用第一线,概率论提供武器。
我们在学习R的时候,会做过假设检验。做假设检验的时候会有一个基本的技术就是构造出统计量,这些统计量要满足一定的概率密度分布,然后我算这个统计量的值,来判定它在这个密度分布里面,分布在哪个区域,出现在这个区域内的可能性有多高,如果可能性太低,我们就判定我们的假设检验是不成立的。 那么如何构造这个统计量,这是一个很有技术的东西,同时也是由数学家来完成的,那这个工作就是概率论所作的事情。
古典概率论: 扔硬币,正面1/2反面1/2,扔的次数之间是相互独立的。 但是这个等概率事件确实是一个不是很严谨的事情。仔细想一想其实是很有趣的。 柯尔莫哥洛夫创建现代概率论 他将概率论提出了许多公理,因此将概率论变成了非常严谨的一门学科。
学会和运用概率,会使人变得聪明,决策更准确。
统计学 : 统计学可以分为:描述统计学与推断统计学 描述统计学 :使用特定的数字或者图表来体现数据的集中程度和离散程度。比如:每次考试算的平均分,最高分,各个分数段的人数分布等,也是属于描述统计学的范围。 推断统计学 :根据样本数据推断总体数据特征。比如:产品质量检查,一般采用抽样检测,根据所抽样本的质量合格率作为总体的质量合格率的一个估计。 统计学的应用十分广泛,可以说,只要有数据,就有统计学的用武之地。目前比较热门的应用:经济学,医学,心理学,IT行业大数据方面等。
例如:对于 1 2 3 4 5 这组数据,你会使用哪个数字作为代表呢? 答案是3。 因为3是这组数据的中心。 对于一组数据,如果只容许使用一个数字去代表这组数据,那么这个数字应该如何选择???-----选择数据的中心,即反映数据集中趋势的统计量。 集中趋势:在统计学里面的意思是任意种数据向 中心值靠拢 的程度。它可以反映出数据中心点所在的位置。 我们经常用到的能够反映出集中趋势的统计量: 均值:算数平均数,描述 平均水平 。 中位数:将数据按大小排列后位于正中间的数描述,描述 中等水平 。 众数:数据种出现最多的数,描述 一般水平 。
均值:算数平均数 例如:某次数学考试种,小组A与小组B的成员成绩分别如下: A:70,85,62,98,92 B:82,87,95,80,83 分别求出两组的平均数,并比较两组的成绩。
组B的平均分比组A的高,就是组B的总体成绩比组A高。
中位数:将数据按大小顺序(从大到小或者从小到大)排列后处于 中间位置 的数。 例如:58,32,46,92,73,88,23 1先排序:23,32,46,58,73,88,92 2找出中间位置的数23,32,46, 58 ,73,88,92 如果数据中是偶数个数,那么结果会发生什么改变? 例如:58,32,46,92,73,88,23,63 1先排序:23,32,46,58,63,73,88,92 2找出处于中间位置的数:23,32,46, 58 , 63 ,73,88,92 3若处于中间位置的数据有两个(也就是数据的总个数为偶数时),中位数为中间两个数的算数平均数:(58+63)/2=605 在原数据中,四个数字比605小,四个数字比605大。
众数:数据中出现次数最多的数(所占比例最大的数) 一组数据中,可能会存在多个众数,也可能不存在众数。 1 2 2 3 3 中,众数是2 和 3 1 2 3 4 5 中,没有众数 1 1 2 2 3 3 4 4 中,也没有众数 只要出现的频率是一样的,那么就不存在众数 众数不仅适用于数值型数据,对于非数值型数据也同样适合 {苹果,苹果,香蕉,橙子,橙子,橙子,橙子,桃子}这一组数据,没有什么均值中位数科研,但是存在众数---橙子。 但是在R语言里面没有直接计算众数的内置函数,不过可以通过统计数据出现的频率变相的去求众数。
下面比较一下均值,中位数,众数三个统计量有什么优点和缺点 [上传失败(image-57f18-1586015539906)]
例子: 两个公司的员工及薪资构成如下: A:经理1名,月薪100000;高级员工15名,月薪10000;普通员工20名,月薪7500 B:经理1名,月薪20000;高级员工20名,月薪11000;普通员工15名,月薪9000 请比较两家公司的薪资水平。若只考虑薪资,你会选择哪一家公司?
A 7500 B 11000
A 7500 B 11000</pre>
若从均值的角度考虑,明显地A公司的平均月薪比B公司的高,但是A公司存在一个极端值,大大地拉高了A公司的均值,这时只从均值考虑明显不太科学。从中位数和众数来看,B公司的薪资水平比较高,若是一般员工,选择B公司显得更加合理。
比较下面两组数据: A: 1 2 5 8 9 B: 3 4 5 6 7 两组数据的均值都是5,但是你可以看出B组的数据与5更加接近。但是有描述集中趋势的统计量不够,需要有描述数据的离散程度的统计量。
极差 :最大值 - 最小值,简单地描述数据的范围大小。 A: 9 - 1 = 8 B: 7 - 3 = 4 同样的5个数,A的极差比B的极差要大,所以也比B的要分散 但是只用极差这个衡量离散程度也存在不足 比如: A: 1 2 5 8 9 B: 1 4 5 6 9 两组数据虽然极差都是相同的,但是B组数据整体分布上更加靠近5。
方差 :在统计学上,更常地是使用方差来描述数据的 离散程度 :数据离中心越远,越离散。 方差越大,就代表这组数据越离散。
对于前面的数据 1 2 5 8 9,前面求的一组数据的方差是125。 将125于原始数据进行比较,可以看出125比原数据都大,这是否就能说明这一组数据十分离散呢? 其实方差与元数据的单位是不一样的,这样比较也是毫无意义的。如果原始数据的单位是m的话,那么方差的单位就是m^2 为了保持单位的一致性,我们引入一个新的统计量:标准差 标准差:sqrt(var()), 有效地避免了因为单位的平方而引起的度量问题。 与方差一样,标准差的值越大,表示数据越分散。 A: 1 2 5 8 9 B: 3 4 5 6 7
某班40个学生某次数学检测的成绩如下:
63,84,91,53,69,81,61,69,78,75,81,67,76,81,79,94,61,69,89,70,70,87,81,86,90,88,85,67,71,82,87,75,87,95,53,65,74,77 对于这一组数字,你能看出什么呢? 或许先算一算平均值,中位数,或者众数
或许算一算这组数据的方差或者标准差
但是即便是统计了上述的数据,我们还是对全班同学的分数分布,没有一个全面的了解。 原始数据太杂乱无章,难以看出规律性,只依赖数字来描述集中趋势与离散程度让人难以对数据产生直观地印象,这是我们就需要用到图标来展示这些数字。
1找出上面数据中的最大值和最小是,确定数据的范围。
将成绩排序后很容易得到最大值是95,最小值是53
2整理数据,将数据按照成绩分为几个组。成绩按照一般50-60,60-70,70-80,80-90,90-100这几个分段来划分(一般都分为5-10组),然后统计这几个分段内部的频数。 可以看到80-90这个分段的人数是最多的。 注意在绘制直方图的时候,一定要知道是左闭右开还是左开右闭。 因为这个可能会直接影响到频数的统计。
上图就是:频数直方图。频数作为纵坐标,成绩作为横坐标。通过直方图我们可以对成绩有一个非常直观的印象。 除了频数直方图,还有一种直方图:频率直方图。与频数直方图相比,频率直方图的纵坐标有所改变,使用了频率/组距。 频率=频数/总数;组距就是分组的极差,这里的组距是10
除了直方图外,画一个简单的箱线图也可以大致看出数据的分布。
想要看懂箱线图,必须要学习一些箱线图专业的名词: 下四分位数:Q1,将所有的数据按照从小到大的顺序排序,排在第25%位置的数字。 上四分位数:Q3,将所有的数据按照从小到大的顺序排序,排在第75%位置的数字。 四分距:IQR,等于Q3-Q1,衡量数据离散程度的一个统计量。 异常点:小于Q1-15IQR或者大于Q3+15IQR的值。 (注意是15倍的IQR) 上边缘:除异常点以外的数据中的最大值 下边缘:除异常点以外的数据种的最小值
茎叶图可以在保留全部数据信息的情况下,直观地显示出数据的分布情况。 左边是茎,右边是叶。 若将茎叶图旋转90度,则可以得到一个类似于直方图的图。跟直方图一样,也可以直观地知道数据的分布情况。 并且可以保留所有的数据信息。 茎叶图的画法也非常的简单: 将数据分为茎和叶两部分,这里的茎是指十位上的数字,叶是指给上的数字。 将茎部份(十位)从小到大,从上到下写出来 相对于各自的茎,将同一茎(十位)从小到大,从左往右写出来。
但是茎叶图也有缺陷,因为百位和十位同时画在茎叶图的时候,容易区分不开。同时也可能出现却叶的情况。
以时间作为横坐标,变量作为纵坐标,反映变量随时间推移的变化趋势。
显示一段时间内的数据变化或者显示各项之间的比较情况。
根据各项所占百分比决定在饼图中扇形的面积。简单易懂,通俗明了。可以更加形象地看出各个项目所占的比例大小。 适当的运用一些统计图表,可以更生动形象的说明,不再只是纯数字的枯燥描述。
学习链接: >
统计学就业前景怎样对口的就业单位有哪些呀
统计本科毕业一年来了,有很多经验源给你。
这个专业重在应用,理论学的时候很难,不过记住一些基础知识就行,重要的是但是把SPSS、SAS等统计软件学好了。而且重要的是excel和SPSS,在学校的时候很少用到excel,但是找工作的时候发现真正用的多的还是这个,所以软件 *** 作是基本功。
这个专业没有什么证书可以考的,统计从业资格证本科学历是免考的,会计证又和统计差很远,想考的话基本就是从头学起,而且会计专业一堆一堆的,除非你考CPA,不然没必要。什么证券、银行从业资格证的,也是鸡肋,因为统计进金融行业的话,也是做数据分析市场研究,不需要的,除非做客户经理才要证。
找工作时发现一般大公司如果要做行业研究数据分析,都要硕士和英语好,所以如果能考研路就很宽,当然了本科的话,软件 *** 作好也可以。
就业的话,现在统计专业还是挺紧俏的,尤其是结合电子商务、IT业、市场研究,我原来在深圳,现在在北京,都挺好找工作的,HR都说现在数据分析越来越重要。个人觉得越发达的城市,统计学越好找工作,小城市就比较难。
感想就这么多,有什么可以继续问我。
华东师大 统计学 怎么样
1、统计和精算是两个专业方向,不过都要和数学打交道的,统计偏经济一些,精算偏保险一些。
2、统计这些年就业还行,不过本科就业一般,最好读个硕士,去证券、银行或者 都还不错。
3、华师大的统计在国内没有怎么听过,一般统计比较好的在几个大综合院校(武汉大学、东南大学等)和财经院校。
华师大统计学好吗
我是华师的,但不是统计的,有些朋友是统计的,据说华师的统计还是可以的,现在统计和金融保险等合并为一个学院,优势互补,你也可以学一些金融保险方面的课程,前景还是不错的。
统计是一个基础学科,并且如果有考研或者继续深造的意向的话,还是很好的,因为现在许多专业的研究都需要统计人才,外专业的非常欢迎统计的学生读他们的研究生的。
关于就业,金融与统计学院的就业率在华师来说排名还是比较靠前的,大概第二、三的样子,今年统计系就业不错,但据说有时这个系不太稳定,不过我觉得应该是在上升期哦~
其实大学学什么专业不是很重要,一般从事与本专业对口的工作很少很少的,最重要的是你对什么感兴趣,然后选一个差不多的沾点边自己感兴趣的就行了哈,重要的还是自己去学,充实自己
希望能帮到你哦!希望以后在华师能够看到你呵
我能保研,但是不知道学统计南开大学好还是华东师大好
支持您选南开大学。
南开大学的统计学系成立于1999年,设有统计学专业。它的前身是概率论与信息统计系的数理统计专业和有关的学科组织。南开大学的数理统计专业创建于1981年,分别于1983年、1984年和1990年开始招收本科生、硕士研究生和博士研究生,成为我国最早设立这一专业并招收各类学生的学校之一,也是国内概率论与数理统计的五个重点学科之一。二十年来培养了各类统计人才数百名(学士600余名,硕士50余名,博士10余名),他们到国家统计局、省市统计局、全国高校、科研和企事业单位等各行业就业或进一步深造,在国民经济、教育、科研和各类事业中发挥着重要作用。南开大学概率统计学科为全国的重点学科。
华东师范大学统计学怎么分方向
1、专业预分流时间定在第一学年结束的暑假。第2学期结束后学生就可以提出预分流志愿、学院在暑假开始第 2 周确定各专业学生名单(预),学生在开 学前 1 周完成专业课选课。
2、预分流设定各专业人数上限:统计学专业人数上限设为 70 人,金融工程、 保险学专业各为 35 人。
3、预分流时实行志愿优先原则。所谓志愿优先,就是首先满足学生的第一志愿,对第二志愿的学生,不管你的专业课成绩多好,均排在第一志愿的学生后 面。以此类推第二志愿等等。
4、对同一志愿的学生,若人数超过专业设定上限,则按专业课综合成绩进行排序。专业课综合成绩由统计学院第一年专业基础课组成,采用加权标准分计算。
(5)华师大统计专业的学生就业岗位扩展阅读:
统计学专业(理学学位、非师范)
培养目标:华东师范大学统计学专业致力于培养具有扎实的概率论和数理统计学基础理论、具有一定的统计计算和大数据处理能力的卓越人才,其毕业生既拥有从事数据收集、分析、解释和呈现等相关工作和研究的能力,亦具备进一步深造和提高所必需的扎实的理论功底。
专业课:概率论、数理统计、回归分析、抽样调查、试验设计、多元统计分析、时间序列分析、非参数统计、贝叶斯统计等。
华东师范大学统计学院-统计学院专业分流安排
华师大统计学好吗
当然好啊,怎么说也是重点本科,而且华师大的心理学研究系在全国大学院校中都是名列前茅的
概率论与数理统计专业考研,武汉大学和华东师范大学的这个专业,都如何,就业呢
综合名气武大,但是华东师范大学这个专业在上海很吃香,可以进保险公司,如果在上海发展,还是选华东师范大学,扎起珠三角和武汉的话,还是武大吧!
上华东师大的软件工程和统计学哪个比较好
你好,我就是华师大软件工程的。
1告诉你几个事实,软件工程历来是华师大专就业率、签约率排属名前三的专业,不过金融与统计学院也差不多,就业形势都不错(见图)
2你至少要读一个学年,如果你想转专业,需要较高的绩点要求,并且有的专业要去面试,08级从软院转走的不到8个(共180人)
3专业是好专业,关键看你对他有没有兴趣。如果有兴趣,你会觉得如鱼得水,因为何院长在华师大很牛的,能争取到不少出国交流机会,以前日语过2级的学长日企就直接跟他签约了;如果没兴趣,那你会觉得学数据结构、机组很痛苦的
你可以去访问软院网址://seiecnuecn/Pages/Homeaspx
4你说的不错,的确比较累,有的研究生基本上每天不到2点不睡的。但是大一基本上没什么课,业余生活时间非常丰富
华东师范大学统计学专业怎么样
华东师范大学统计学专业,
是国家级特色专业,
是该校最好的15个专业之一。
祝你新年学业进步。
我想考华师大的研究生,但是在统计专业和金融徘徊,到底哪个专业的发展前景更好,我本科是数学~
如果致力于学术数学转金融最好,未来发展前景也最好。现在金融专业烂大街,但是真正高精尖的还是数学底子好的,这种人太稀缺了。
都知道理学院学的同样专业但是学的内容不同,那么理学院的统计学专业都学些什么呢?
其实不同的学校学到的看可能不同,我就大概说一下。
1统计学是应用数学的一个分支,主要通过利用概率论建立数学模型,收集所观察系统的数据,进行量化分析、总结,做出推断和预测,为相关决策提供依据和参考。本专业主要包括一般统计和经济统计两类就业方向,培养具有良好的数学或数学与经济学素养,掌握统计学的基本理论和方法,能熟练地运用计算机分析数据,能在企业、事业单位和经济、管理部门从事统计调查、统计信息管理、数量分析等开发、应用和管理工作,或在科研、教育部门从事研究和教学工作的高级专门人才。
2其实现在统计学这门学科和其他各种学科交叉的都很厉害,所以适合统计学本科背景的研究生专业有很多,关键是要看你喜欢什么,将来什么打算,比较靠谱的选择有: 继续念统计学,有偏数理统计的硕士、也有偏应用统计的硕士,换专业成本最低。
3就业方面。听到统计这词,第一时间就会想到统计局,那是政府部门。进政府部门,就要首先过了千军万马挤独木桥的“国考”——国家公务员考试,这个是进政府部门的基本门槛,再选部门。公务员待遇非常不错,不是铁饭碗也比较稳定,努力点就要竞争科长职位。本专业主要包括一般统计和经济统计两类就业方向,培养具有良好的数学或数学与经济学素养,掌握统计学的基本理论和方法,能熟练地运用计算机分析数据,能在企业、事业单位和经济、管理部门从事统计调查、统计信息管理、数量分析等开发、应用和管理工作,或在科研、教育部门从事研究和教学工作的高级专门人才。
最后,理学院学到理科专业一般都要比普通的更深入一些,更难一些,所以希望我的建议能够帮助你。
以上就是关于# 大数据的统计学基础全部的内容,包括:# 大数据的统计学基础、统计学的发展史是什么、华师大统计专业的学生就业岗位等相关内容解答,如果想了解更多相关内容,可以关注我们,你们的支持是我们更新的动力!
欢迎分享,转载请注明来源:内存溢出
微信扫一扫
支付宝扫一扫
评论列表(0条)