NumPy,是“Numerical Python”的简称,是Python编程语言中的一个核心数学库,专注于高效处理多维数组和矩阵数据。在数据分析领域,NumPy发挥着举足轻重的作用,它提供了丰富的功能和工具,可以执行复杂的数学运算、线性代数操作以及统计分析。NumPy的高性能数组处理能力,使得用户可以轻松地处理大规模数据集,无论是进行数值计算、数据转换还是数据清洗,NumPy都能提供强大的支持。其简洁而直观的API设计,使得数据分析和科学计算变得更为简单高效。在数据科学、机器学习、科学计算等领域,NumPy都是不可或缺的基础工具,助力研究人员和工程师们快速实现复杂的数据处理和分析任务。

本节课程仅作为学习NumPy的参考,并让你脱离基础性的NumPy使用,通过一些具体问题的形式学习NumPy的进阶使用方法。

Read more »

Numpy是Python中科学计算的核心库。它提供了一个多维数组对象,以及用于高并发处理这些数组的向量化计算工具集。NumPy允许用户在Python环境中进行向量和矩阵计算,并且由于许多底层函数实际上是用C编写的,因此你可以体验在原生Python中永远无法体验到的速度。NumPy绝对是Python在科学计算领域成功的关键之一,如果你想要进入Python中的数据科学或机器学习,你就要必须学习它。Have a good day!

Read more »

通过前面两周课程的学习,我们了解了现代科研体系中编程语言的必要作用,而Python等解释型语言由于其便捷易开发的优势又是其中的主力军之一。以及对Python语言的基础知识包括注释、对象类型(数字、字符串、布尔型等)、运算符(位运算符、赋值运算符、逻辑运算符)等。第三周课程我们将学习Python语言编写时的缩进规则、函数的用法、流程控制语句以及NumPy模块的初步使用。

Read more »

使用 19 世纪文献生成的词嵌入的 T-SNE 可视化

简单介绍

t 分布随机邻域嵌入( t-SNE ) 是一种统计方法,通过为每个数据点在二维或三维地图中赋予一个位置来可视化高维数据。它是一种非线性降维技术,用于在二维或三维低维空间中嵌入高维数据以进行可视化。具体而言,它通过二维或三维点对每个高维对象进行建模,这样相似的对象由附近的点建模,而不同的对象则以高概率由远处的点建模。
t-SNE 算法包括两个主要阶段。首先,t-SNE 在高维对象对上构建一个概率分布,这样相似的对象被分配更高的概率,而不同的点被分配更低的概率。其次,t-SNE 在低维图中的点上定义一个相似的概率分布,并最小化两个分布之间关于图中点位置的Kullback-Leibler 散度(KL 散度)。
对于包含n 个元素的数据集,t-SNE 的运行时间为$O(n^2)$,空间为$O( n^2)$。

Read more »

大二时拜访友人,从合肥乘火车哐当哐当摇晃去上海,感叹前路迷蒙自身渺小,途中随笔。如今面临学生向老师的身份骤变,不觉时光如梭,如梦如幻。

这些年路大部分都是自己一个人走的,车是一个人坐的,所以常常靠拿着一本书看,好把时间打发过去。去上海的路上,我在火车上看到两个孩子,正巧我在读这本$\lfloor$平凡的世界$\rceil$。这两个孩子一开始友好的互相讲故事,然后开始吹牛,最后小男孩和小女孩竟然吵起了架。

Read more »

“在学校开课的时节,我便专心教书,等到学校放寒暑假,我才从事写作。” —— 老舍

第一次接触Hexo|NexT主题博客,是在某位多晶相变专家的个人主页。当时不仅为他的学识所折服,更惊叹于如此优雅的知识分享方式。那时就曾想,以后一定要搭建自己的博客,来记录自己的经历和成长,今日终如愿。

Read more »
0%