flight
/
LuatOS


			
				
					
						
						
							123456789101112131415161718192021222324252627282930313233343536373839404142434445464748495051525354555657585960616263646566676869707172737475767778798081828384858687888990919293
							-- LuaTools 需要 PROJECT 和 VERSION
PROJECT = "fft_q15_test"
VERSION = "1.0.0"

_G.sys = require("sys")

sys.taskInit(function()
	if not fft then
		while 1 do sys.wait(1000) log.info("bsp", "此BSP不支持fft库，请检查") end
	end

	-- FFT 参数配置
	local N = 2048      -- FFT 点数
	local fs = 2000     -- 采样频率 (Hz)
	local freq = 200    -- 测试信号频率 (Hz)

	log.info("fft", "q15 测试开始", "N=" .. N, "fs=" .. fs, "freq=" .. freq)

	-- 分配 zbuff：
	-- 整数缓冲（U12 以 16bit 承载，低12位有效）用于 q15 内核
    local real_i16 = zbuff.create(N * 2)
    local imag_i16 = zbuff.create(N * 2)

	-- 生成 U12 整数正弦写入 i16（避免浮点预处理干扰）
	for i = 0, N - 1 do
		local t = i / fs
		local x = math.sin(2 * math.pi * freq * t)
		local val = math.floor(2048 + 2047 * x + 0.5)
		if val < 0 then val = 0 end
		if val > 4095 then val = 4095 end
		real_i16:seek(i * 2, zbuff.SEEK_SET); real_i16:writeU16(val)
		imag_i16:seek(i * 2, zbuff.SEEK_SET); imag_i16:writeU16(0)
	end

	-- 生成 Q15 旋转因子到 zbuff（避免任何浮点旋转因子）
	local Wc_q15 = zbuff.create((N // 2) * 2)
	local Ws_q15 = zbuff.create((N // 2) * 2)
	fft.generate_twiddles_q15_to_zbuff(N, Wc_q15, Ws_q15)

	-- 执行 Q15 FFT（输入为 U12），显式传入 Q15 twiddle
	local t0 = mcu.ticks()
	fft.run(real_i16, imag_i16, N, Wc_q15, Ws_q15, { core = "q15", input_format = "u12" })
	local t1 = mcu.ticks()
	log.info("fft", "q15 FFT 完成", "耗时:" .. (t1 - t0) .. "ms")

	-- 扫描前半谱，寻找主峰
	local peak_k, peak_pow = 1, -1
	for k = 1, (N // 2) - 1 do
		real_i16:seek(k * 2, zbuff.SEEK_SET)
		imag_i16:seek(k * 2, zbuff.SEEK_SET)
		local rr = real_i16:readI16()
		local ii = imag_i16:readI16()
		local p = rr * rr + ii * ii
		if p > peak_pow then
			peak_pow = p
			peak_k = k
		end
	end
	local peak_freq = (peak_k) * fs / N
	log.info("fft", "主峰(Hz/bin)", string.format("%.2f", peak_freq), peak_k)

	-- 比较：使用 f32 内核处理相同输入（验证 q15 与 f32 结果一致性）
	-- 复制相同的 U12 输入到新的 zbuff
	local real_f32 = zbuff.create(N * 4)  -- f32 需要 4 字节
	local imag_f32 = zbuff.create(N * 4)
	for i = 0, N - 1 do
		real_i16:seek(i * 2, zbuff.SEEK_SET)
		local val = real_i16:readU16()
		real_f32:seek(i * 4, zbuff.SEEK_SET)
		imag_f32:seek(i * 4, zbuff.SEEK_SET)
		real_f32:writeF32(val)  -- 直接写入 U12 原始值
		imag_f32:writeF32(0.0)
	end

	-- 生成 f32 旋转因子
	local Wc, Ws = fft.generate_twiddles(N)

	-- 执行 f32 FFT（输入为 U12）
	local t2 = mcu.ticks()
	fft.run(real_f32, imag_f32, N, Wc, Ws, { input_format = "u12" })
	local t3 = mcu.ticks()
	local dt_f32 = (t3 - t2)
	log.info("fft", "f32 FFT 完成", "耗时:" .. dt_f32 .. "ms")

	-- 总结耗时对比
	log.info("fft", "对比(q15 vs f32, ms)", string.format("%d / %d", (t1 - t0), dt_f32))

	-- 注意：本测试刻意避免浮点旋转因子与f32路径，确保纯Q15链路
end)

sys.run()