了解 C++ 数据类型、漏洞以及与 Java 的主要区别
2024-12-25 17:20:12
本文深入介绍了 c 中的各种数据类型,包括原始类型、派生类型和用户定义类型,同时还解决了缓冲区溢出和不正确的类型转换等常见漏洞。此外,它还强调了 c 和 java 之间的主要区别,重点介绍每种语言如何处理数据类型和内存管理,并提供安全编程的实用代码示例。
java 和 c 是两种面向对象编程 (oop) 语言,各有优缺点。本文探讨了两种语言之间的一些差异,重点是 c 数据类型和漏洞。 as well 上的代码示例以及有关如何防止常见问题的代码示例,例如 c 中的缓冲区溢出、整数溢出、不正确的类型转换和空指针取消引用。
c 数据类型
在 c 中,数据大致分为三种类型:原始(或内置)数据类型、派生数据类型和用户定义数据类型,见图 1:
图1c/c 数据类型注意:来自 argarwal 的“c 数据类型”(2023)
- 原始类型也称为基本类型,是预定义的基本数据类型
在 c 中,请参阅下面的列表:
立即学习“Java免费学习笔记(深入)”;
整数(int):存储整数,通常需要4字节内存,范围从-2,147,483,648到2,147,483,647(argarwal, 2023)
表 1c 整数注意:来自 c 参考的“基本类型”(n.d.)
字符(char): 存储字符,要求,1 个字节,范围为 -128 到 127(对于 unsigned char 为 0 到 255)。请注意,从技术上讲,它们是正整数,使用其底层 ascii 代码将字符存储为整数。
宽字符 (wchar_t) 存储宽字符,通常需要 2 或 4 个字节,具体取决于平台。
布尔值(bool):存储逻辑值,true或false,通常需要1个字节。从技术上讲,它们是正整数,其中 o 为真,所有其他正整数为假。
浮点(float):存储单精度浮点数,通常需要4个字节。
double(双精度):存储双精度浮点数,需要8个字节
long double — 扩展精度浮点类型。不一定映射到 ieee-754 规定的类型。 (c 参考,n.d.,第 1 页)
void (void):具有空值集或不存在值的类型,通常用于不返回任何值的函数。
“输入一组空值。这是一个不完整的外部站点类型。无法完成(因此,不允许使用 void 类型的对象)。没有 void 数组,也没有对 void 的引用。但是,指针指向 void。并且允许返回 void 类型的函数(其他语言的过程)。” (c 参考,n.d.,第 1 页)
- 派生数据类型是从原始数据类型派生而来的,它们包括:
数组:相同类型元素的集合。指针:变量的内存地址。功能: 执行特定任务的代码块。引用:另一个变量的别名。 (阿加瓦尔,2023)
- 用户定义的数据类型,顾名思义是由用户定义的
- 类: 将变量和函数存储到一个单元中。
- 结构(struct): 与类类似,但具有公共默认访问权限。
- 并集: 将不同的数据类型存储在同一内存位置。
- 枚举(enum):与整数常量相关的名称集,广泛用于视频游戏行业。
- typedef: 允许为现有数据类型创建或分配新名称。
在列出 c 和 java 数据类型之间的差异之前,我想先讨论一下这两种语言之间的主要差异和相似之处。
两种语言都是面向对象编程(oop)语言。然而,c 是平台相关的,而 java 是平台无关的,因为 java 的虚拟机 (jvm) 组件使用解释器将 java 编译为字节码,可以在任何具有 jvm 的系统上运行,这就是所谓的“ “一次编写,随处运行”功能(eck,2015)。此外,c 同时支持过程编程和面向对象编程,而 java 是严格的 opp,这使得 c 更适合操作系统编程。此外,java 是严格面向对象的,缺乏对全局变量或自由函数的支持(如 c 那样)。 java 将所有内容封装在类中。
c 和 java 之间的数据类型差异下面列出了 c 和 java 之间的数据类型差异。
- 两种语言都有原始数据类型;然而,c 同时支持有符号和无符号类型,这使得 c 原始数据类型更加灵活,但在无符号时安全性也较低。 java 原始数据类型默认是有符号的(eck,2015)。
- java 原始数据类型具有固定大小并且与平台无关,而 c 原始数据类型存储大小与平台相关。
- c 提供了原始类型和对象类型之间的一致性。 java 还区分基元和对象;但是,它具有用于基本类型的“包装类”,例如 integer for int,允许它们具有类似对象的行为(sruthy,2024)。
- java 不支持结构体或联合数据类型,而 c 支持。
- c 支持指针和引用类型,而 java 的支持非常有限。这是出于安全原因的选择。
- c 变量具有全局作用域和命名空间作用域。另一方面,java 变量没有全局作用域;但是,它们可以具有包范围。
- java 支持文档注释“javadocs”,而 c 不支持。
使用 c 数据类型时可能存在的漏洞
如果处理不当,c 数据类型可能会产生安全问题。因此,理解和识别 c 数据类型漏洞至关重要。下面列出了处理 c 数据类型时可能出现的最常见漏洞以及如何缓解这些漏洞。
1。缓冲区溢出
当写入内存的数据超过缓冲区分配的容量时,就会发生缓冲区溢出。这可能会导致程序崩溃或恶意代码执行。为了防止缓冲区溢出,重要的是在编码之前检查边界,并使用像“fgets”这样的库函数来抵抗缓冲区溢出。避免使用容易出现缓冲区溢出的“scanf”、“strcpy”、“printf”、“get”和“strcaf”(guardrails,2023)。
请参阅下面的代码示例。
#include <iostream> #include <cstdio> int main() { char buffer[10]; std::cout << "enter a string: "; fgets(buffer, sizeof(buffer), stdin); // avoids buffer overflow by // limiting input std::cout << "you entered: " << buffer << std::endl; return 0; }
2。整数上溢和下溢
当尝试存储在整数变量中的值超过整数可以容纳的最大值时,就会发生整数溢出(snyk 安全研究团队,2022 年)。当一个值小于整数可以容纳的最小值时,就会发生整数下溢。
为了防止整数上溢和下溢,请在执行算术运算之前始终验证值,请参阅下面的代码示例:
#include <iostream> #include <climits> // for int_max int add(int a, int b) { if (a > 0 && b > int_max - a) { std::cerr << "integer overflow detected!" << std::endl; return -1; } return a + b; } int main() { int x = int_max - 1; int y = 2; std::cout << "result: " << add(x, y) << std::endl; return 0; }
注意,在将a和b相加之前,在add函数中,会检查将它们相加会导致溢出的条件,这里的和大于允许的整数最大值。
3。类型转换不正确
将有符号整数转换为无符号整数时,经常会发生不正确的类型转换,从而导致意外的数据丢失。这可以通过非隐式转换数据类型来避免,例如,避免将 double 转换为 float 或将有符号类型转换为无符号类型。
请参阅下面的代码示例:
#include <iostream> void checklength(int len) { if (len < 0) { std::cerr << "negative length detected!" << std::endl; return; } std::cout << "length is: " << len << std::endl; } int main() { // incorrect implicit conversion unsigned int value = -5; // unsigned int are always non-negative checklength(static_cast(value)); // properly handle conversion return 0; }
4。指针初始化
空指针是一个众所周知的漏洞,可能导致程序崩溃和潜在的恶意利用。在取消引用指针之前,请务必检查指针是否为“nullptr”。
请参阅下面的代码作为示例。
struct list { void *p; struct list *next; }; int f(struct list *l) { int max = -1; while (l) { int i = *((int*)l->p); // Cast void* to int* max = i > max ? i : max; l = l->next; } return max; }
请注意,“void”用于在链表中存储通用指针,并且在使用之前将其强制转换为“int”。
总而言之,通过了解 c 数据类型及其相关风险来了解 java 和 c 之间的差异,对于编写安全程序至关重要。这可以通过仔细管理数据类型、执行边界检查、验证类型转换和安全处理指针(例如通过检查空值和正确转换 void 指针)来完成。
参考文献:
亚当,j. 和凯尔,s.(2020)。类型检查超越类型检查器,通过切片和运行。第 11 届 acm sigplan 自动程序分析工具国际研讨会 (tapas 2020) 论文集。计算机协会,23-29。摘自:https://dl-acm-org.csuglobal.idm.oclc.org/doi/10.1145/3427764.3428324
argarwal, h.(2023 年,9 月 23 日)。 c 数据类型。 googsforgeeks。 https://www.geeksforgeeks.org/cpp-data-types/
c 参考(n.d.)。基本类型。 cppreference.com。 https://en.cppreference.com/w/cpp/language/types/
eck,d.j.(2015)。第一章概述:心理景观。使用 java 编程简介(第七版)。 cc by-nc-sa 3.0。 http://math.hws.edu/javanotes/
guardrails,(2023 年,4 月 27 日)。最重要的 c 安全漏洞以及如何缓解这些漏洞。安全大道。 https://securityboulevard.com/2023/04/the-top-c-security-vulnerabilities-and-how-to-mitigate-them/
snyk 安全研究团队(2022 年,8 月 16 日)。斯尼克。https://snyk.io/blog/top-5-c-security-risks/
sruthy,(2024 年,3 月 7 日)。 c 与 java:c 和 java 之间的 30 个最大差异(附示例)。软件测试帮助。 https://www.softwaretestinghelp.com/cpp-vs-java/
最初发表于 alex.omegapy on medium,由 level up coding 于 2024 年 10 月 12 日发布。
以上就是了解 C++ 数据类型、漏洞以及与 Java 的主要区别的详细内容,更多请关注图灵教育其它相关文章!