Ascend C保姆级教程：我的第一份Ascend C代码-中关村在线

本文提供AscendC保姆级教程，从一个简单的实例出发，带你体验AscendC算子开发的基本流程。

完成实例开发之前，需要先了解一些必备的背景知识。

1背景知识

·多核并行

使用AscendC开发的算子运行在AICore上，AICore是昇腾NPU硬件平台的计算核心，NPU内部有多个AICore。AscendC编程过程中会将需要处理的数据拆分同时在多个AICore上运行，从而获取更高的性能。多个AICore共享相同的指令代码，每个核上的运行实例唯一的区别是block_idx不同，开发者只需要关注单核上的处理程序,也就是核函数。

·流水并行

上文提到，开发者只需要关注单核处理程序（核函数），那么如何实现核函数的具体逻辑呢？AscendC提供流水线式的编程范式，基于编程范式可以快速搭建算子实现的代码框架，实现流水并行。

流水线并行的概念和工业生产中的流水线是类似的，任务1完成对某片数据的处理后，将其加入到通信队列，任务2空闲时就会从队列中取出数据继续处理；可以类比为生产流水线中的工人只完成某一项固定工序，完成后就交由下一项工序负责人继续处理。

AscendC编程范式是一种流水线式的编程范式，把算子核内的处理程序，分成多个流水任务：“搬入、计算、搬出”，通过队列（Queue）完成任务间通信和同步，并通过统一的内存管理模块（Pipe）管理任务间通信内存。开发者只需聚焦实现“搬入、计算、搬出”内容。

·孪生调试

基于NPU域算子的调用接口编写程序，通过毕昇编译器编译后运行，可以完成算子NPU域的运行验证；基于CPU域算子的调用接口编写程序，通过标准的GCC编译器进行编译后运行，并通过GDB通用调试工具进行单步调试，精准验证程序执行流程是否符合预期。孪生调试的能力，大大提升了算子的调试效率。下文的示例开发，仅介绍核函数CPU侧和NPU侧的运行验证，具体的调试步骤将会在后续的文章中详细介绍。

2开发流程

本文将引导你完成以下任务，体验AscendC算子开发的基本流程。

1. 使用AscendC完成Add算子核函数开发；

2. 使用ICPU_RUN_KFCPU调测宏完成算子核函数CPU侧运行验证；

3.使用<<<>>>内核调用符完成算子核函数NPU侧运行验证。

在正式的开发之前，还需要先完成环境准备和算子分析工作，开发AscendC算子的基本流程如下图所示：

参考本文进行开发之前请先获取样例代码目录quick-start(链接：https://gitee.com/ascend/samples/tree/master/cplusplus/level1_single_api/4_op_dev/6_ascendc_custom_op/kernel_invocation/Add)，该样例代码只保留了部分代码框架，核心代码在下文的指导步骤中体现。您可以在阅读本文时，将指导步骤中的代码拷贝至对应位置，即可快速完成AscendC算子的开发。

3环境准备

·CANN软件安装

开发算子前，需要先准备好开发环境和运行环境，开发环境和运行环境的介绍和具体的安装步骤可参见昇腾社区文档的CANN软件安装指南。

·环境变量配置

安装CANN软件后，使用CANN运行用户编译、运行时，需要以CANN运行用户登录环境，执行source$${install_path}/set_env.sh命令设置环境变量，其中$${install_path}为CANN软件的安装目录。

4算子分析

主要分析算子的数学表达式、输入、输出以及计算逻辑的实现，明确需要调用的AscendC接口。

1.明确算子的数学表达式及计算逻辑。

Add算子的数学表达式为：

z = x + y

计算逻辑是：要完成AICore上的数据计算，输入数据需要先从外部存储GlobalMemory搬运进AICore的内部存储LocalMemory，然后使用计算接口完成两个输入参数相加，得到最终结果，再搬出到外部存储GlobalMemory上。

2. 明确输入和输出。

oAdd算子有两个输入：x与y，输出为z。

o本样例中算子的输入支持的数据类型为half（float16），算子输出的数据类型与输入数据类型相同。

o算子输入支持shape（8，2048），输出shape与输入shape相同。

o算子输入支持的format为：ND。

3. 确定核函数名称和参数。

o您可以自定义核函数名称，本样例中核函数命名为add_custom。

o根据对算子输入输出的分析，确定核函数有3个参数x，y，z；x，y为输入在GlobalMemory上的内存地址，z为输出在GlobalMemory上的内存地址。

4. 确定算子实现所需接口。

o实现涉及外部存储和内部存储间的数据搬运，查看AscendC API参考中的数据搬移接口，需要使用DataCopy来实现数据搬移。

o本样例只涉及矢量计算的加法操作，查看AscendC API参考中的矢量计算接口，初步分析可使用双目指令Add接口实现x+y。

o计算中使用到的Tensor数据结构（数据操作的基础数据结构），使用AllocTensor、FreeTensor进行申请和释放。

o并行流水任务之间使用Queue队列完成通信和同步，会使用到EnQue、DeQue等接口。

通过以上分析，得到AscendC Add算子的设计规格如下：

表1 Ascend C Add算子设计规格

5核函数开发

完成环境准备和初步的算子分析后，即可开始AscendC核函数的开发。开发之前请先获取样例代码目录quick-start(链接：https://gitee.com/ascend/samples/tree/master/cplusplus/level1_single_api/4_op_dev/6_ascendc_custom_op/kernel_invocation/Add)，以下核函数开发的样例代码在add_custom.cpp中实现。

本样例中使用多核并行计算，即把数据进行分片，分配到多个核上进行处理。AscendC核函数是在一个核上的处理函数，所以只处理部分数据。分配方案是：数据整体长度TOTAL_LENGTH为8*2048，平均分配到8个核上运行，每个核上处理的数据大小BLOCK_LENGTH为2048。下文的核函数，只关注长度为BLOCK_LENGTH的数据应该如何处理。

5.1核函数的定义

进行核函数的定义，并在核函数中调用算子类的Init和Process函数。请将下文代码添加至add_custom.cpp的“核函数实现”注释处。

extern "C"__global__ __aicore__ void add_custom(GM_ADDR x, GM_ADDR y, GM_ADDRz)

{

KernelAdd op;

op.Init(x, y,z);

op.Process();

}

使用__global__函数类型限定符来标识它是一个核函数，可以被<<<...>>>调用；使用__aicore__函数类型限定符来标识该核函数在设备端AI Core上执行。指针入参变量需要增加变量类型限定符__gm__，表明该指针变量指向Global Memory上某处内存地址为了统一表达，使用GM_ADDR宏来修饰入参，GM_ADDR宏定义如下：

#define GM_ADDR __gm__ uint8_t* __restrict__

算子类的Init函数，完成内存初始化相关工作，Process函数完成算子实现的核心逻辑。

5.2算子类定义

本样例中定义KernelAdd算子类，其具体成员如下。请将下文代码添加至add_custom.cpp的“算子类实现”注释处。

classKernelAdd {

public:

__aicore__inline KernelAdd(){}

//初始化函数，完成内存初始化相关操作

__aicore__inline void Init(GM_ADDR x, GM_ADDR y, GM_ADDR z){}

//核心处理函数，实现算子逻辑，调用私有成员函数CopyIn、Compute、CopyOut完成矢量算子的三级流水操作

__aicore__inline void Process(){}

private:

//搬入函数，完成CopyIn阶段的处理，被核心Process函数调用

__aicore__inline void CopyIn(int32_t progress){}

//计算函数，完成Compute阶段的处理，被核心Process函数调用

__aicore__inline void Compute(int32_t progress){}

//搬出函数，完成CopyOut阶段的处理，被核心Process函数调用

__aicore__inline void CopyOut(int32_t progress){}

private:

TPipepipe; //Pipe内存管理对象

TQue<QuePosition::VECIN,BUFFER_NUM> inQueueX, inQueueY;//输入数据Queue队列管理对象，QuePosition为VECIN

TQue<QuePosition::VECOUT,BUFFER_NUM> outQueueZ; //输出数据Queue队列管理对象，QuePosition为VECOUT

GlobalTensor<half>xGm, yGm, zGm; //管理输入输出GlobalMemory内存地址的对象，其中xGm,yGm为输入，zGm为输出

};

内部函数的调用关系示意图如下：

由此可见除了Init函数完成初始化外，Process中完成了对流水任务：“搬入、计算、搬出”的调用，开发者可以重点关注三个流水任务的实现。

5.3Init函数实现

初始化函数Init主要完成以下内容：设置输入输出GlobalTensor的GlobalMemory内存地址，通过Pipe内存管理对象为输入输出Queue分配内存。

上文我们介绍到，本样例将数据切分成8块，平均分配到8个核上运行，每个核上处理的数据大小BLOCK_LENGTH为2048。那么我们是如何实现这种切分的呢？

每个核上处理的数据地址需要在起始地址上增加GetBlockIdx()*BLOCK_LENGTH（每个block处理的数据长度）的偏移来获取。这样也就实现了多核并行计算的数据切分。

以输入x为例，x+ BLOCK_LENGTH * GetBlockIdx()即为单核处理程序中x在GlobalMemory上的内存偏移地址，获取偏移地址后，使用GlobalTensor类的SetGlobalBuffer接口设定该核上GlobalMemory的起始地址以及长度。具体示意图如下。

上面已经实现了多核数据的切分，那么单核上的处理数据如何进行切分？

对于单核上的处理数据，可以进行数据切块（Tiling），在本示例中，仅作为参考，将数据切分成8块（并不意味着8块就是性能最优）。切分后的每个数据块再次切分成2块，即可开启doublebuffer，实现流水线之间的并行。

这样单核上的数据（2048个数）被切分成16块，每块TILE_LENGTH（128）个数据。Pipe为inQueueX分配了两块大小为TILE_LENGTH* sizeof(half)个字节的内存块，每个内存块能容纳TILE_LENGTH（128）个half类型数据。数据切分示意图如下。

具体的初始化函数代码如下：

__aicore__inline void Init(GM_ADDR x, GM_ADDR y, GM_ADDR z)

{

//多核并行，设定当前核上GlobalMemory的起始地址以及长度xGm.SetGlobalBuffer((__gm__half*)x + BLOCK_LENGTH * GetBlockIdx(), BLOCK_LENGTH);

yGm.SetGlobalBuffer((__gm__half*)y + BLOCK_LENGTH * GetBlockIdx(), BLOCK_LENGTH);

zGm.SetGlobalBuffer((__gm__half*)z + BLOCK_LENGTH * GetBlockIdx(), BLOCK_LENGTH);

//通过pipe为queue分配内存，单位为Bytes

pipe.InitBuffer(inQueueX,BUFFER_NUM, TILE_LENGTH * sizeof(half));

pipe.InitBuffer(inQueueY,BUFFER_NUM, TILE_LENGTH * sizeof(half));

pipe.InitBuffer(outQueueZ,BUFFER_NUM, TILE_LENGTH * sizeof(half));

}

5.4 核心处理函数实现

基于矢量编程范式，将核函数的实现分为3个基本任务：CopyIn，Compute，CopyOut。任务之间通过队列进行通信，交互示意图如下：

Process函数中通过如下方式调用这三个函数。

__aicore__inline void Process()

{

//开启doublebuffer后循环次数需要乘以2

constexprint32_t loopCount = TILE_NUM * BUFFER_NUM;

//多个任务实现流水并行

for(int32_t i = 0; i < loopCount; i++) {

CopyIn(i);

Compute(i);

CopyOut(i);

}

CopyIn函数实现。

__aicore__inline void CopyIn(int32_t progress)

{

//1、从队列中分配Tensor

LocalTensor<half>xLocal = inQueueX.AllocTensor<half>();

LocalTensor<half>yLocal = inQueueY.AllocTensor<half>();

//2、使用DataCopy接口将GlobalTensor数据拷贝到LocalTensor

DataCopy(xLocal,xGm[progress * TILE_LENGTH], TILE_LENGTH);

DataCopy(yLocal,yGm[progress * TILE_LENGTH], TILE_LENGTH);

//3、将LocalTensor放入搬入数据的存放位置VecIn的Queue中

inQueueX.EnQue(xLocal);

inQueueY.EnQue(yLocal);

}

Compute函数实现。

__aicore__inline void Compute(int32_t progress)

{

//1、使用DeQue从VecIn中取出LocalTensor

LocalTensor<half>xLocal = inQueueX.DeQue<half>();

LocalTensor<half>yLocal = inQueueY.DeQue<half>();

LocalTensor<half>zLocal = outQueueZ.AllocTensor<half>();

//2、调用Add指令完成双目矢量计算

Add(zLocal,xLocal, yLocal, TILE_LENGTH);

//3、使用EnQue将计算结果LocalTensor放入到搬出数据的存放位置VECOUT的Queue中

outQueueZ.EnQue<half>(zLocal);

//4、使用FreeTensor将释放不再使用的LocalTensor

inQueueX.FreeTensor(xLocal);

inQueueY.FreeTensor(yLocal);

}

CopyOut函数实现。

__aicore__inline void CopyOut(int32_t progress)

{

//1、使用DeQue接口从VecOut的Queue中取出LocalTensor

LocalTensor<half>zLocal = outQueueZ.DeQue<half>();

//2、使用DataCopy接口将LocalTensor拷贝到GlobalTensor上

DataCopy(zGm[progress* TILE_LENGTH], zLocal, TILE_LENGTH);

//3、使用FreeTensor将不再使用的LocalTensor进行回收

outQueueZ.FreeTensor(zLocal);

}

6核函数运行验证

异构计算架构中，NPU（kernel侧）与CPU（host侧）是协同工作的，完成了kernel侧核函数开发后，即可编写host侧的核函数调用程序，实现从host侧的APP程序调用算子，执行计算过程。

除了上文核函数实现文件add_custom.cpp外，核函数的调用与验证还需要需要准备以下文件：

·调用算子的应用程序：main.cpp。

·输入数据和真值数据生成脚本文件：add_custom.py。

·编译cpu侧或npu侧运行的算子的编译工程文件：CMakeLists.txt。

·编译运行算子的脚本：run.sh。

本文仅介绍调用算子的应用程序的编写，该应用程序在main.cpp中体现，其他内容您可以在quick-start中直接获取。

6.1host侧应用程序框架编写

内置宏__CCE_KT_TEST__是区分运行CPU模式或NPU模式逻辑的标志，在同一个main函数中通过对__CCE_KT_TEST__宏定义的判断来区分CPU和NPU侧的运行程序。

int32_tmain(int32_t argc, char* argv[])

{

size_tinputByteSize = 8 * 2048 * sizeof(uint16_t); // uint16_t representhalf

size_toutputByteSize = 8 * 2048 * sizeof(uint16_t); // uint16_t representhalf

uint32_tblockDim = 8;

#ifdef__CCE_KT_TEST__

//用于CPU调试的调用程序

#else

//NPU侧运行算子的调用程序

#endif

return0;

}

6.2CPU运行验证

完成算子核函数CPU侧运行验证的步骤如下：

1、分配共享内存，并进行数据初始化；

2、调用ICPU_RUN_KF调测宏，完成核函数CPU侧的调用；

3、释放申请的资源。

请将下文代码添加至上面代码框架的“用于CPU调试的调用程序”注释处。

uint8_t*x = (uint8_t*)AscendC::GmAlloc(inputByteSize);

uint8_t*y = (uint8_t*)AscendC::GmAlloc(inputByteSize);

uint8_t*z = (uint8_t*)AscendC::GmAlloc(outputByteSize);

ReadFile("./input/input_x.bin",inputByteSize, x, inputByteSize);

ReadFile("./input/input_y.bin",inputByteSize, y, inputByteSize);

AscendC::SetKernelMode(KernelMode::AIV_MODE);

ICPU_RUN_KF(add_custom,blockDim, x, y, z); // use this macro for cpu debug

WriteFile("./output/output_z.bin",z, outputByteSize);

AscendC::GmFree((void*)x);

AscendC::GmFree((void*)y);

AscendC::GmFree((void*)z);

6.3NPU侧运行验证

完成算子核函数NPU侧运行验证的步骤如下：

1、初始化Device设备；

2、创建Context绑定设备；

3、分配Host内存，并进行数据初始化；

4、分配Device内存，并将数据从Host上拷贝到Device上；

5、用内核调用符<<<>>>调用核函数完成指定的运算；

6、将Device上的运算结果拷贝回Host；

7、释放申请的资源。

请将下文代码添加至上面代码框架的“NPU侧运行算子的调用程序”注释处。

//AscendCL初始化

CHECK_ACL(aclInit(nullptr));

//创建Context绑定设备

aclrtContextcontext;

int32_tdeviceId = 0;

CHECK_ACL(aclrtSetDevice(deviceId));

CHECK_ACL(aclrtCreateContext(&context,deviceId));

aclrtStreamstream = nullptr;

CHECK_ACL(aclrtCreateStream(&stream));

//分配Host内存，并进行数据初始化

uint8_t*xHost, *yHost, *zHost;

uint8_t*xDevice, *yDevice, *zDevice;

CHECK_ACL(aclrtMallocHost((void**)(&xHost),inputByteSize));

CHECK_ACL(aclrtMallocHost((void**)(&yHost),inputByteSize));

CHECK_ACL(aclrtMallocHost((void**)(&zHost),outputByteSize));

//分配Device内存，并将数据从Host上拷贝到Device上

CHECK_ACL(aclrtMalloc((void**)&xDevice,inputByteSize, ACL_MEM_MALLOC_HUGE_FIRST));

CHECK_ACL(aclrtMalloc((void**)&yDevice,outputByteSize, ACL_MEM_MALLOC_HUGE_FIRST));

CHECK_ACL(aclrtMalloc((void**)&zDevice,outputByteSize, ACL_MEM_MALLOC_HUGE_FIRST));

ReadFile("./input/input_x.bin",inputByteSize, xHost, inputByteSize);

ReadFile("./input/input_y.bin",inputByteSize, yHost, inputByteSize);

CHECK_ACL(aclrtMemcpy(xDevice,inputByteSize, xHost, inputByteSize, ACL_MEMCPY_HOST_TO_DEVICE));

CHECK_ACL(aclrtMemcpy(yDevice,inputByteSize, yHost, inputByteSize, ACL_MEMCPY_HOST_TO_DEVICE));

//用内核调用符<<<>>>调用核函数完成指定的运算

add_custom_do(blockDim,nullptr, stream, xDevice, yDevice, zDevice);

CHECK_ACL(aclrtSynchronizeStream(stream));

//将Device上的运算结果拷贝回Host

CHECK_ACL(aclrtMemcpy(zHost,outputByteSize, zDevice, outputByteSize, ACL_MEMCPY_DEVICE_TO_HOST));

WriteFile("./output/output_z.bin",zHost, outputByteSize);

//释放申请的资源

CHECK_ACL(aclrtFree(xDevice));

CHECK_ACL(aclrtFree(yDevice));

CHECK_ACL(aclrtFree(zDevice));

CHECK_ACL(aclrtFreeHost(xHost));

CHECK_ACL(aclrtFreeHost(yHost));

CHECK_ACL(aclrtFreeHost(zHost));

CHECK_ACL(aclrtDestroyStream(stream));

CHECK_ACL(aclrtDestroyContext(context));

CHECK_ACL(aclrtResetDevice(deviceId));

CHECK_ACL(aclFinalize());

6.4执行一键式编译运行脚本，编译和运行应用程序

脚本执行方式如下：

bash run.sh<kernel_name> <soc_version> <core_type> <run_mode>

<kernel_name>表示需要运行的算子。

<soc_version>表示算子运行的AI处理器型号。

<core_type>表示在AiCore上或者VectorCore上运行。

<run_mode>表示算子以cpu模式或npu模式运行。

1.CPU模式下执行如下命令（算子运行的AI处理器型号以Ascend910为例）：

bash run.shadd_custom ascend910 AiCore cpu

运行结果如下，当前使用md5sum对比了所有输出bin文件，md5值一致表示实际的输出数据和真值数据相符合。

2. NPU模式下执行如下命令：bashrun.sh add_custom ascend910 AiCore npu

运行结果如下，当前使用md5sum对比了所有输出bin文件，md5值一致表示实际的输出数据和真值数据相符合。

至此，你已经完成了AscendC算子开发的快速入门，更多内容请参考：

《AscendC官方教程》（链接：https://www.hiascend.com/zh/ascend-c?utm_source=cann&utm_medium=article&utm_campaign=all）

Ascend C保姆级教程：我的第一份Ascend C代码

OPPO Find X8 Pro(12GB/256GB)

vivo X100 Ultra(12GB/256GB)

vivo X200 Pro(12GB/256GB)

HUAWEI Mate 60（12GB/256GB）

Redmi K70至尊版(12GB/256GB)

字节跳动将把TikTok总部迁至伦敦 英国政府开绿灯

清华大学生起诉ofo反赔400元，这到底是怎么回事呢？

互联网免费时代终结 全面付费用户被套路

英法德未跟风封禁TikTok 英国甚至对其大开绿灯

早报：华为开发者大会9月举行 三星中国工厂关闭

三星 Galaxy S25 / Ultra 保护膜曝光，新机已通过国内认证

小米手环9 Pro外观图公布 性能升级可期

小米15 Ultra渲染图曝光：徕卡四摄布局变了

27 寸 4K 10bit 低过 900 元：科睿 P6 显示器 873 元探底

毒液女主人翁扮演cosplay真人版还原度太高了

华为Mate 70即将上市 iPhone 16再便宜也别买

Win11精简版上线 附下载链接 4.9GB容量干净好用

OPPO Find X8 Pro外观设计曝光：真机非常精致

AMD官方确认史上最强APU 性能媲美移动版RTX 4070

小米新品今晚开售：2999元，配备双机械臂

全新小米平板7系列10月29日亮相：3.2K屏/第三代骁龙8s平台

iPhone 17 Pro Max曝光 灵动岛有变化

售价7999元！华为版绿水鬼“绿野传奇”正式发布

华为nova 13全配色公布 辨识度超高

6600mAh续航王者 荣耀X60系列首销：1199元起

田园夏色

充电宝押金什么时候退

狙击英特尔？AMD锐龙9000全线降价

小米众筹推出Type-C双头分线器：支持辅供电 45元

首发骁龙8 Elite！小米15系列开启预定

手机秀光影（南德田园风光）

Word禁用宏、Excel禁用宏设置方法，关闭宏在哪里设置方法？

鸿蒙史诗级更新！华为正式发布HarmonyOS NEXT 5.0版本

最美小直屏！小米15官图发布，金属直角中框+圆润倒角切边

小米15系列官图公布！小米数字系列史上最精致、最流畅

除了ipad，还有其他性能不错的平板电脑吗？

何为单反相机

福特购买小米SU7去美国：CEO开了六个月不想换

AM4接口八年了还在更新！AMD将推出2款锐龙5000新品

iPhone 16全系官方降价，最高优惠达1600元

h3c路由器密码破解

三星Galaxy S25 Ultra配色细节曝光：黑色蓝色绿色钛色

小米 15 Pro 外观公布：全等深四微曲屏，陶瓷镜头 DECO 设计

日本美女cosplay展身材 紧身衣美爆了

最新笔记本独立显卡排名

小米15完整外观公布：6.36英寸直屏/1.38mm四等边/火山口镜头

一加13外观定了！虞书欣等三位明星已喜提真机

功耗600W！体积又大了？疑似RTX 5090谍照曝光

怎样和电脑连接

小米平板7官宣：3.2K屏幕＋骁龙8s Gen 3＋澎湃OS 2

华为实在是太猛了 市场份额夸张了

小米电视S Pro Mini LED 2025系列开售：3000级峰值亮度，65英寸4599元

电水壶功率一般有多大，烧水壶多少W？

华为nova 13系列手机四款配色海报公布：洛登绿 / 羽砂紫 / 羽砂白 / 星耀黑

小米15将首发骁龙8至尊版！发布会准备中

荣耀 Magic7 手机“月影灰”配色亮相：居中对称摄像头、直角边框设计

为什么感觉苹果iPhone 11还有很多人去买？

小米SU7 Ultra量产版10月29日发布：已开启预约，价格有点小贵

雷军转发“车主自制小米SU7广告”：你可以接商单了

华为nova 13系列开售！麒麟8000+100W快充 2699起

华为Mate 20 X 5G版和普通版有什么区别？

小米手环9 Pro亮相！全面屏设计 外观质感升级

小米悬浮键盘官宣：小米平板7系列专用，0-124°无级调节/全域机械按压触控板

小米 Watch S4 手表官宣：对讲模式 / 手势操作，10 月 29 日发布

iqoo7电池多大？vivo iQOO手机电池容量？

小米发布会新品曝光 手机、平板、电视、手表齐上阵

全景光透声学箱体 漫步者HECATE G3000桌面音箱正式开售

杨笠吐槽男生痴迷电子设备：让男人快乐的最便宜东西

OPPO Find X8 Pro(12GB/256GB)

vivo X100 Ultra(12GB/256GB)

vivo X200 Pro(12GB/256GB)

HUAWEI Mate 60（12GB/256GB）

Redmi K70至尊版(12GB/256GB)

HUAWEI nova 13(256GB)

OPPO Find X8(12GB/256GB)

iQOO Z9 Turbo+(12GB/256GB)

苹果iPhone 16（128GB）

vivo X200 Pro mini(12GB/256GB)

更多频道

字节跳动将把TikTok总部迁至伦敦英国政府开绿灯

互联网免费时代终结全面付费用户被套路

早报：华为开发者大会9月举行三星中国工厂关闭

小米手环9 Pro外观图公布性能升级可期

Win11精简版上线附下载链接 4.9GB容量干净好用

iPhone 17 Pro Max曝光灵动岛有变化

华为nova 13全配色公布辨识度超高

6600mAh续航王者荣耀X60系列首销：1199元起

日本美女cosplay展身材紧身衣美爆了

华为实在是太猛了市场份额夸张了

小米手环9 Pro亮相！全面屏设计外观质感升级

小米发布会新品曝光手机、平板、电视、手表齐上阵

全景光透声学箱体漫步者HECATE G3000桌面音箱正式开售