技术栈(持续更新中)
已掌握或使用过的工具与技术
IDE
Free Pascal
Delphi
Dev C++
Virtual Studio 2013/2017
Virtual Studio Code
Eclipse
IntelliJ IDEA
Pycharm
Android Studio
Matlab
Masm
语言
Pascal
C/C++
Python
Java
SQL
机器学习相关
TensorFlow
Keras
OpenCV
Scikit-Learn
ModelArts
Kaldi
DeepSpeech
数据库
SQL Server 2000
MySQL
Navicat
C++/Java 框架
MFC
Win32 API
Spring Boot
MyBatis
硬件
Raspberry Pi
Serial Comm
ESP 8266
MPU 6050
8253/8255/8259
前端
Vue.js
Bootstrap
Hexo
音频音乐相关
Librosa
Music21
其它工具
音乐制作
Cubase
Overture
Sonic P ...
本人项目汇总(持续更新中)
汉诺塔游戏与演示程序 (C++, MFC) 介绍 代码
Rookemon — 类似精灵宝可梦的游戏 (C++, Win32 API) 介绍 代码 演示
钢琴和弦查询器 (Python, PyQt) 介绍 代码 演示
TSP 师生汇科研交流平台 (Pascal, Delphi) 代码
智能垃圾拾取分类小车 (Raspberry Pi, Tensorflow) 代码
考务管理系统 (Java, Spring Boot) 代码
堆箱子游戏 (Unity) 代码
垃圾宝 — 垃圾图像识别分类手机APP (Java, Tensorflow) 代码
Scorpionn — 自制深度学习框架 (Python) 代码
咕咕语翻译器 (JavaScript) 链接
在线和弦查询器 (JavaScript) 链接
旅游地图 (JavaScript) 链接
多功能手势识别新乐器 (Python, Max/MSP) 演示 暂未开源
音乐自动伴奏系统 (Python, Pytorch, GAN) 暂未开源
AutoHarmonizer — 音乐和声自动配置系统 (Python, Tensorflow) 链接
...
Librosa/Madmom/Torchaudio时频转换算法对比
本文对 Librosa、Madmom 和 Torchaudio 三个库中获取频谱图的方法细节进行对比。
分帧细节对比
librosa
参数设置举例
12345678sample_rate = 22050n_fft = 1764 # 441 * 4win_length = n_fft # window_sizehop_length = 441 # hop_sizecenter = Trueduration = 1num_samples = sample_rate * durationrandom_audio = np.random.randn(num_samples)
短时傅里叶变换
librosa.stft
1234567D = librosa.stft( random_audio, n_fft=n_fft, hop_length=hop_length, win_length=win_length, center=center)
mel频谱图
librosa.feature.melspectrogram
12345678mel_spectrogr ...
音频分帧的相关计算公式
音频分帧
关于分帧(Framing)的介绍可见 https://brianmcfee.net/dstbook-site/content/ch09-stft/Framing.html
帧数计算方法:
Nframe=1+⌊Nsample−window_sizehop_size⌋N_{frame} = 1 + \left\lfloor\frac{N_{sample} - window\_size}{hop\_size}\right\rfloor
Nframe=1+⌊hop_sizeNsample−window_size⌋
其中Nsample为采样点数量,window_size为窗长(也称window_length),hop_size为帧移长度(也称hop_length)。注意在不同音频处理库中的分帧算法可能不同,此公式仅作参考,详见下一篇博文。
帧率(fps)计算方法:
fps=sample_ratehop_sizefps = \frac{sample\_rate} {hop\_size}
fps=hop_sizesample_rate
其中sample_rate为采样率,ho ...
低于1.5kg轻薄笔记本不完全汇总(2023年11月)
本文对一些轻薄笔记本( < 1.5kg )的基本信息进行了汇总,仅供参考。其中“容量”列只记录了该机型的一种配置,不代表该机型只有这种配置。“屏幕”列中,除特殊说明外,OLED一般为镜面屏,IPS和LED一般为雾面屏。“参考价格”列的价格在汇总时处于“双十一”的影响下,之后应该会有所变化,仅供参考。如有错误,欢迎指正。
品牌
型号
重量
屏幕
参考价格
处理器
电池
容量
备注
华硕
灵耀13 2023
1kg
OLED 13.3英寸 2880x1800
8394
i7-1355U
63Wh
32G+1T
华硕
灵耀X13
1kg
OLED 13.3英寸 2880x1800
5299
R7-6800U
67Wh
16G+1T
注意处理器非最新代
华硕
灵耀14 2023
1.39kg
OLED 14英寸 2880x1800
5999
i7-1360P
75Wh
16G+1T
华硕
破晓Air
990g
OLED 14英寸 2880x1800
9469
i7-1355U
63Wh
16G+1T
线下店无样机展示
华硕
a豆14 2023
1.4k ...
Hexo博客迁移步骤
Hexo博客迁移步骤(踩坑记录)
本文记录了博主在更换电脑后将旧电脑本地的Hexo博客项目迁移到新电脑,并实现在新电脑上正常发布Hexo博客至GitHub的步骤。
说明:
建议优先使用前置步骤+解决方案(一);
博主对Hexo等工具并不是很熟悉,本文仅供参考,如有错误,欢迎指正;
本地的Hexo博客项目本身也可上传至GitHub进行管理和备份,但此方法不在本文讨论范围内。
前置步骤
无论是使用解决方案(一)还是解决方案(二),都需要先执行以下前置步骤:
安装Git
下载链接:Git
需要完成相应的SSH配置,网上教程较多,这里省略。
安装Node.js
下载链接:Node.js
所需版本可参考 链接
安装hexo-cli
安装方式:在任意位置打开 git bash,执行指令 npm install hexo-cli -g,其中 -g 代表全局安装,hexo-cli 是 hexo 框架的 command line interface
此处列出博主使用的版本供参考:
旧电脑
新电脑
node.js: 14.15.0 npm: 6.14.8 hexo-cli: ...
使用Python处理xlsx表格
使用Python处理xlsx表格的操作示例
载入表格文件
1234import openpyxlworkbook = openpyxl.load_workbook(r".\dataset.xlsx")worksheet = workbook.worksheets[0]
获取行数和列数
12raw_num = worksheet.max_rowcol_num = worksheet.max_column
获取单元格内容
12x = worksheet.cell(i, j).value# i, j start with index 1
改变单元格内容
12worksheet.cell(i, j, y)# change the value to y
保存修改的内容
12workbook.save(r".\dataset.xlsx")# or workbook.save(r".\new_dataset.xlsx")
使用Python批量处理文件名
使用Python批量处理文件名的操作示例
遍历文件
1234567import osfile_path = r".\audio"for root, dirs, files in os.walk(file_path): for file_name in files: print(file_name)
获取文件后缀
1os.path.splitext(file_name)[1]
寻找某个字符的位置
1file_name.find('_')
重命名文件
12os.rename(root + '/' + file_name, root + '/' + new_name)# or os.rename(root + '\\' + file_name, root + '\\' + new_name)
律学初探(二)
本文修改后出版于《音频音乐与计算机的交融——音频音乐技术2》,谢绝转载。
音律计算法及三种常见律制介绍见 律学初探(一)
六、中国律学简史
中国的律学研究,仅从十二律名的出现算起,至今已有2500多年,可谓历史悠久。我们可以根据中国律学发展的特点,将中国律学史分为四个时期:
1)三分损益律发现时期,约公元前8世纪至公元前3世纪,即春秋战国时期;
2)探求新律时期,约公元前3世纪至公元14世纪,即汉代至元代;
3)十二平均律发现时期,公元16世纪前后,即明代;
3)律学研究新时期,1911年至今。
(一)三分损益律发现时期
在讨论律学发展史之前,我们需要明确一些中国古代音乐相关知识。
中国自西周时期起,音乐就已经有了一定的发展。西周宫廷中有着由1400多人组成的音乐机构,乐器据《诗经》记载也已经达到29种之多。春秋战国时期更是“百花齐放,百家争鸣”,对音律的研究发展提供了条件。
中国古代有五声音阶、七声音阶,以“宫、商、角、徵、羽”作为音阶中各音的“阶名”。以“变”表示低半音,以“清”表示高半音,例如“变徵”表示比“徵”低半音,“清角”表示比“角”高半音。“宫商角徵羽”的名称早期记载 ...
国外部分音乐人工智能/音乐科技研究机构科研项目简介
本文对国外部分音乐人工智能/音乐科技科研机构的科研项目与教学课程设置作简要介绍,包括英国伦敦玛丽女王大学(Queen Mary)的数字音乐中心(C4DM)、西班牙巴塞罗那庞培法布拉大学(UPF)的音乐技术研究组(MTG)、美国斯坦福大学的音乐与声学计算机研究中心(CCRMA)以及法国的声学/音乐协调研究所(IRCAM)。
本文写于2021年1月,资料均来自各机构官方网站。
C4DM
英国伦敦玛丽女王大学的数字音乐中心(Centre for Digital Music,简称C4DM)是一个世界领先的音频音乐技术领域的多学科研究小组。自创始人员于2001年加入玛丽女王大学以来,该中心已发展成为英国首屈一指的数字音乐研究小组。
C4DM属于伦敦玛丽女王大学的电子工程与计算机科学学院,其主要的研究领域包括音乐信息检索、音乐信息学、语义音频、音乐语义网、音乐音频数字信号处理、音频工程、机器听觉、声音合成、音乐感知与认知、增强乐器和声音交互设计。
科研团队与项目
一、C4DM的智能音频工程研究团队致力于智能录音技术、高级音效、现场声音制作技术、混音格式转换技术以及音频编辑自动化技术的开发,目前 ...