اعداد در کامپیوتر: ساختار، ذخیره سازی و محاسبات

درک و فهم کامل از نحوه برخورد کامپیوتر ها با اعداد بحث بسیار مهمی هستش و میشه گفت شاید یکی از ستون های اصلی علوم کامپیوتر و نرم افزار باشه این بحث، البته این نکته رو همینجا توی شروع کار بگیم که منظور ما از اعداد در واقع اعداد صحیح هستش توی لغت ریاضیش، یا integral data type توی لغت کامپیوتریش. مبنای کارکرد اکثر کامپیوتر ها معمولا به شکل دودویی یا باینری هستش یعنی کامپیوتر ها فقط اعداد ۰ و ۱ رو میفهمن که توی این پست ما میخوایم بریم ببینیم که اعداد صحیح چطوری توی یه کامپیوتر دودویی نمایش داده میشن، چطور دخیره میشن و چطوری عمل های محاسباتی مثل ضرب و تقسیم روشون انجام میشه.

دیتا تایپ Integer

به نوع دیتای اعداد صحیح توی کامپیوتر و نرم افزار عموما integer (اینتیجر) میگن، یه integer میتونه یا صفر باشه یا یه عدد مثبت باشه یا یه عدد منفی و هیچ وقت اعشاری نمیشه، اغلب توی زبان های برنامه نویسی static-type اینتیجر ها به دو دسته تقسیم میشن:

۱.اعداد Unsigned: فقط شامل اعداد مثبت (صفر و بالاتر) میشه.

۲.اعداد Signed: شامل اعداد مثبت به علاوه اعداد منفی (منفی یک و پایین تر) میشه.

که این integer ها به شکل یک رشته ای از اعداد دودویی یعنی صفر و یک نمایش داده میشن، و هر چقدر طول این رشته بزرگ تر باشه یعنی صفر و یک های بیشتری پشت سر هم ردیف بشن ما میتونیم اعداد بزرگ تری رو باهاش نمایش بدیم.

شکل باینری Integer ها

همونطور که بالاتر هم اشاره کردیم کامپیوتر ها از سیستم عددی دودویی استفاده میکنن یعنی فقط اعداد صفر و یک که بر مبنای دو هستند رو میفهمن، به هر کدوم از این اعداد صفر و یک، یک bit (بیت) میگن که این bit دوباره خودش مخفف binary digit یعنی اعداد دودویی هستش، این اعداد با کنار هم قرار گرفتن و تشکیل یک رشته میتونن اعداد صحیح بزرگ تر از یک رو نشون بدن و موقعیتشون توی این رشته مقدارشون رو مشخص میکنه مثلا عدد چهارم از راست توی این رشته با به توان رسوندن ۲ به ۴ منفی ۱ که سه میشه، بدست میاریم، که مقدارش میشه ۸: 1000 = 2^3 = 8

شکل باینری اعداد

اعداد Unsigned

یک عدد Unsigned میتونه از تمام بیت های یک رشته استفاده کنه تا یک عدد مثبت رو توی خودش نگه داره، برای مثال با یک رشته ۴ بیتی ما میتونیم این رنج از اعداد رو نمایش بدیم:

کمترین - باینری: 0000 = عدد صحیح: 0

بیشترین - باینری: 1111 = عدد صحیح: 15

اعداد Signed

اعداد Signed باید بتونن هم مقادیر مثبت رو نشون بدن و هم مقادیر منفی رو، برای این مورد یکی از مرسوم ترین راه هایی که وجود داره اینه که یک بیت رو (معمولا پر ارزشترین بیت که میشه اولین بیت از سمت چپ یا به اصطلاح MSB, Most Significant Bit) به عنوان بیت sign یا علامت رزرو کنیم و از اون استفاده کنیم برای مشخص کردن منفی یا مثبت بودن اعداد، با توجه به مقدارش:

0 مشخص میکنه که این یه عدد مثبته
1 مشخص میکنه که این یه عدد منفیه

متود های انکود اعداد Signed

به دلیل اینکه اعداد Signed نیاز دارن که بتونن به طور همزمان هم اعداد منفی رو نشون بدن و هم اعداد مثبت رو، چالش مختلفی رو این موضوع وجود داشت و در طی این زمان متود ها و تکنیک های مختلفی ابداع شد که چند تا از مهم ترین هاشون رو الان با هم برسی میکنیم:

۱. متود Sign-Magnitude Representation یا Sign-Bit Representation: ساده ترین و یکی از اولین متود ها برای مشخص کردن اعداد منفی روش Sign-Magnitude بود که کامپیوتر های نسل اول مثل IBM ۷۰۹۰ از این روش استفاده میکردن، روش نمایشش خیلی ساده است و مثل روش نمایش ریاضیش که یه sign مثل ۱- یا ۱+ که پشت عدد میزاریم اینجا هم پر اهمیت ترین بیت (MSB) یعنی اولین بیت از سمت چپ رو به عنوان بیت sign در نظر میگیریم، اگر این بیت مقدارش ۱ باشه عدد ما منفیه و اگر ۰ باشه عدد ما مثبته، مثلا:

باینری	عدد صحیح
0000	0+
0001	1+
0010	2+
0011	3+
0100	4+
0101	5+
0110	6+
0111	7+
1000	0-
1001	1-
1010	2-
1011	3-
1100	4-
1101	5-
1110	6-
1111	7-

اما خب این روش مشکلات و محدودیت های زیادی داشت مثلا:

توی این روش ما دو تا صفر داشتیم یکی صفر مثبت (0000) و یکی صفر منفی (1000)
توی عملیات های حسابی مثلا جمع یا تفریق ما بر اساس sign-bit رفتار و لاجیک متفاوتی نیاز داشتیم، مثلا توی اعداد منفی برای اضافه کردنی عددی به یک بیت نیاز داشتیم که مقدار بیت اون عدد رو کم کنیم ازش و توی اعداد مثبت این بر عکس میشد و باید اضافه میکردیم مقدار بیتش رو که این باعث ایجاد پیچیدگی توی پیاده سازی سخت افزاری و نرم افزاری میشد:

	باینری	عدد صحیح	باینری	عدد صحیح	باینری	عدد صحیح
عدد اول	0010	2+	0111	7+	1101	5-
عدد دوم	1010	2-	1010	2-	0011	3+
حمع باینری	1100	4-	0001	1+	0000	0+
جمع صحیح		0+		5+		2-

بحث signed-extension هم دقیقا مثل بحث عملیات های حسابی نیاز به لاجیک پیچیده ای داشت:

عدد صحیح	۴-بیت	۵-بیت	۶-بیت
2+	0010	00010	000010
7+	0111	00111	000111
2-	1010	10010 (! = 11010)	100010 (! = 111010)
7-	1111	10111 (! = 11111)	100111 (! = 111111)

۲. متود One’s Complement: دقیقا مثل روش قبلی اینجا هم از پر اهمیت ترین بیت (MSB) استفاده میکنیم برای نمایش اعداد منفی با این تفاوت که مقدار صحیح اعداد میشه مکمل (NOT) عددی که توی رشته بیت نمایش داده میشه یعنی مثلا اگر رشته بیت ما داشت این مقدار رو نشون میداد: 1010 ما برای اینکه عدد صحیحش رو به دست بیاریم باید هر کدوم از بیت هارو بر عکس کنیم یعنی اگر ۰ بود بکنیم ۱ و اگر ۱ بود بکنیم ۰ که برای موردی که مثال زدیم میشه: 0101 = 5 یعنی رشته بیت 1010 داره عدد ۵- رو نشون میده.

شکل باینری	مقدار صحیح
	متود One’s complement	متود Signed bit
0000	0+	0+
0001	1+	1+
0010	2+	2+
0011	3+	3+
0100	4+	4+
0101	5+	5+
0110	6+	6+
0111	7+	7+
1000	7-	0-
1001	6-	1-
1010	5-	2-
1011	4-	3-
1100	3-	4-
1101	2-	5-
1110	1-	6-
1111	0-	7-

با این روش عملیات های حسابی رو ساده تر میشن و بحث signed-extension به شکل ساده ای امکان پذیر میشه، اما همچنان اینجا هم ما دوتا صفر داریم و این مشکل همچنان پا برجاست.

۳. متود Two’s Complement: این روش در حال حاضر استاندارد اصلی و متداول ترین روش نمایش اعداد توی کامپیوتر هستش، نحوه نمایشش دقیقا شبیه به One’s Complement هستش با این تفاوت که بعد از محاسبه مکمل نتیجه رو به علاوه یک میکنیم:

شکل باینری	مقدار صحیح
	متود Two’s complement		متود One’s complement	متود Signed bit
0000	0+		0+	0+
0001	1+		1+	1+
0010	2+		2+	2+
0011	3+		3+	3+
0100	4+		4+	4+
0101	5+		5+	5+
0110	6+		6+	6+
0111	7+		7+	7+
1000	8-		7-	0-
1001	7-	= inverse of 7 +1-bit	6-	1-
1010	6-	= inverse of 6 +1-bit	5-	2-
1011	5-	= inverse of 5 +1-bit	4-	3-
1100	4-	= inverse of 4 +1-bit	3-	4-
1101	3-	= inverse of 3 +1-bit	2-	5-
1110	2-	= inverse of 2 +1-bit	1-	6-
1111	1-	= inverse of 1 +1-bit	0-	7-

بحث Overflow

وقتی که نتیجه یه عمل حسابی (مثلا جمع) از گنجایش نمایش یه رشته بیت بیشتر باشه رشته بیت ما سر ریز یا به اصطلاح Overflow میکنه، مثلا توی یه رشته بیت 8 تایی اگر به بزرگ ترین عدد قابل نمایش یعنی 255 یک بیت اضافه کنیم رشته بیت ما Overflow میکنه و نتیجه میشه صفر، یه مثال هم بخوایم بزنیم توی دنیای واقعی اگه تا حالا به این شمارنده های مکانیکال مثل این صلوات شمار ها یا کیلومتر شما دقت کرده باشید وقتی عدد به ۹۹۹۹۹ میرسه اگه یکی دیگه بهش اضافه بشه عدد میشه صفر و درواقع Overflow میکنه.

کیلومتر شمار

البته Overflow فقط توی جمع اتفاق نمیفته، توی منها هم ممکنه اتفاق بیفته، البته رفتار با توجه به متود مورد استفاده برای نمایش اعداد Signed ممکنه متفاوت باشه، مثلا توی یه رشته بیت 8 تایی طبق متود Two’s Complement اگر بخوایم کوچک ترین عدد ممکن یعنی ۱۲۸- رو منهای یک بکنیم Overflow اتفاق میفته و نتیجه میشه 127+ . تشخیص این موضوع در سطح سخت افزار معمولا هندل میشه و توی اکثر موارد سخت افزار Overflow رو تشخیص میده و با Condition Code Register ها به نرم افزار اطلاع داده میشه، توی متود Two’s Complement یه فرمول خیلی ساده برای تشخیص این موضوع وجود داره که میگه اگر توی یک عمل محاسباتی مثل جمع بیت انتقالی ورودی به sign bit برابر نباشه با بیت انتقالی خروجی Overflow اتفاق افتاده، یعنی اگر یک جمعی باعث شد که یه بیت به sign bit انتقال پیدا کنه و مقدار sign bit هم صفر باشه، Overflow اتفاق میفته.

	باینری	عدد صحیح	باینری	عدد صحیح	باینری	عدد صحیح	باینری	عدد صحیح
عدد اول	1011	5-	0010	2	0111	7+	1011	5-
عدد دوم	1100	4-	0110	6	1110	2-	0011	3
جمع	(1) 0111		(0)1000		(1)0101		(0)1110
بیت ورودی به sign-bit	0	overflow میکنه	1	overflow میکنه	1	overflow نمیکنه	0	overflow نمیکنه
بیت خروجی از sign-bit	1		0		1		0

نمایش Integer ها در زبان های برنامه نویسی

زبان +C/C

ما توی C تایپ های مختلفی برای Integer ها داریم که معمولا سایزشون رو مشخص میکنه مثلا: int, short long و long long، البته سایز نهایی وابسته است به معماری و word size سیستمی که داره بیلد میگیره برنامه رو، بحث Signed بودن یا Unsigned بودن هم به طور واضح با تایپ های signed یا unsigned مشخص میشه.

زبان Go

تو گولنگ دقیقا مثل C ما برای هر سایزی از Integer تایپ های مختلفی داریم با این تفاوت که سایز هم به طور مشخص توی اسم تایپ وجود داره مثلا int8, int16, int32, int64 برای اعداد Signed و برای اعداد Unsigned هم به شکل uint8, uint16, uint32, uint64 هستش.

زبان Java

توی Java برعکس زبان های بالا ما تنوع زیادی توی تایپ های Integer نداریم و دستمون بسته است، کلا دوتا تایپ داریم به اسم int و long که به ترتیب 32 و 64 بیتی هستن و هردو با دیفالت signed هستن و هیچ شکلی از اعداد Unsigned توی جاوا وجود نداره.

مؤخره

برای مباحث درک عمیق کارکرد اپلیکیشن ها یا بهبود پرفورمنس اپلیکیشن ها یا همچنین دیزاین و توسعه یه نرم افزار با کیفیت، یادگیری فهم نحوه کارکرد اعداد توی کامپیوتر یکی از نیاز های مهمی هستش که باید بهش مسلط باشیم، اینکه بفهیم توی سطوح پایین اعداد چطوری نمایش داده میشن یا عمل های محاسباتی چطور روشون اجرا میشه کمک میکنه که برنامه ها یا الگوریتم هایی بنویسیم که خیلی کارآمد تر باشه همچنین با درک این موضوع میتونیم از مشکلات رایجی مثل Overflow جلوگیری کنیم، البته این نکته رو هم بگم درک صرفا این موضوع کافی نیست برای مواردی که گفتیم، اگر علاقه دارید به این موضوعات پیشنهاد میکنم کتاب Computer Systems: A Programmers Perspective رو تهیه کنید و بخونید، مطالب جالب و جامعی توش پیدا خواهید کرد.

دیتا تایپ Integer#

شکل باینری Integer ها#

اعداد Unsigned#

اعداد Signed#

متود های انکود اعداد Signed#

بحث Overflow#

نمایش Integer ها در زبان های برنامه نویسی#

زبان +C/C#

زبان Go#

زبان Java#

مؤخره#