پروتکل انتقال ابرمتن
منشور انتقال ابرمتن (به انگلیسی: Hypertext Transfer Protocol) (مخفف انگلیسی: HTTP) یک پروتکل لایه کاربرد (Application Layer) برای سیستمهای توزیع شده میباشد. این پروتکل عمومی علاوه بر استفاده اصلی آن در ابرمتنها در بسیاری از زمینههای دیگر کامپیوتری مانند سامانه نام دامنه (DNS) قابل استفاده است. از نسخه اولیه، این پروتکل در وب جهانی استفاده میشد و آخرین بهروز رسانی آن در ماه جون ۱۹۹۹ تحت عنوان «HTTP/1.1» صورت گرفت.
گسترش این پروتکل بر عهده نیروی ضربت مهندسی اینترنت (IETF) و کنسرسیوم وب جهانشمول W3C)) است. این امر در گروه کاری پروتکل انتقال ابرمتن (HTTP Working Group) صورت میگیرد.
تاریخچه
تیم برنرز لی، طراح و پیشنهاد دهنده وب جهانیکه اکنون تحت عنوان WWW شناخته میشود، برای اولین بار پروتکل انتقال ابرمتن را به همراه ساختار اولیهٔ زبان نشانه گذاری ابرمتن (HTML) در یک وب سرورساده و یک مرورگرمبتنی بر متن ارائه داد. در این نسخهٔ اولیه تنها روش درخواست (Request Method) موجود GET و تمامی پاسخ ها به زبان HTML بودند.
اولین نسخه مستند پروتکل انتقال ابرمتن نسخهٔ ۰٫۹ آن بود که در سال ۱۹۹۱ منتشر شد. دیو راگت، که در سال ۱۹۹۵گروه کاری پروتکل انتقال ابرمتن (HTTP Working Group) را رهبری میکرد، خواستار گسترش این پروتکل شد و نهایتاً نسخه ۱٫۰ تحت عنوان «HTTP/1.0» در سال ۱۹۹۶ به صورت رسمی معرفی شد.
گروه کاری این پروتکل در ژانویه سال ۱۹۹۷ اولین استاندارد نسخهٔ ۱٫۱ را که در همان زمان توسط بسیاری از مرورگرهاپشتیبانی میشد، به صورت رسمی منتشر کرد. آخرین بهروز رسانی نسخهٔ ۱٫۱ در جون سال ۱۹۹۹در درخواست شماره ۲۶۱۶ (RFC 2616) انجام شد.
ساختار کلی
پروتکل انتقال ابرمتن یک پروتکل درخواست و پاسخ در مدل کلاینت–سرورمیباشد. برای مثال یک مرورگر وبمی تواند یک کلاینت و نرمافزار موجود بر روی سرویسدهندهٔ وبسایت، یک سرور باشد. شروع این پروتکل از طرف کلاینت است که با ارسال یک درخواست HTTP به سمت سرور گفتوگو را آغاز میکند. سرور بر اساس درخواست ارسالی یا منبعی مانند یک فایل را در اختیار کلاینت میگذارد و یا عملیات خاصی را انجام میدهد. نتیجهٔ این عملِ سرور در بستهٔ پاسخ HTTP برای کلاینت ارسال میشود. بستهٔ پاسخ شامل اطلاعات وضعیت و احتمالاً محتویات منبع درخواست شده میباشد.
مرورگر وب یک نمونه از عامل کاربر (به انگلیسی(User Agent) است. از دیگر عوامل کاربر میتوان به خزندهٔ وب، نرمافزار های تلفنهای همراهو نرمافزار های دیگری که به وب متصل شده و از اطلاعات آن استفاده و یا صفحهای را نمایش میدهند، اشاره کرد.
پروتکل انتقال ابرمتن یک پروتکل لایهٔ کاربرد است که در مجموعه پروتکل اینترنتطراحی شده و مورد استفاده قرار میگیرد. این پروتکل با فرض اینکه لایهٔ حمل (Transport Layer)زیرین آن قابل اعتماد است طراحی شده و معمولاً از پروتکل هدایت انتقال (TCP)به عنوان لایهٔ زیرین استفاده میکند. با این حال از این پروتکل بر روی لایههای غیرقابل اطمینان نیز استفاده میشود. مثلا در پروتکل SSDP، پروتکل انتقال ابرمتن بر روی پروتکل دادهنگار کاربر(یک پروتکل غیر امن) مورد استفاده قرار میگیرد.
منابع HTTP همگی با یک شناسانهٔ یکنواخت منبع (URI) یا به طور مشخصتر با یک نشانی وب (URL) آدرسدهی و مشخص میشوند. تمامی این آدرسها با نشانهٔ http یا https آغاز میگردد. از این آدرسها در زبان نشانهگذاری ابرمتنبه صورت گسترده برای انتقال بین صفحات مختلف استفاده میگردد و از آن تحت عنوان پیوند یا لینکیاد میشود.
نسخهٔ ۱٫۱ این پروتکل برخلاف نسخهٔ ۱٫۰ قابلیت استفاده از یک اتصال (به انگلیسی: Connection) برای چندین درخواست را دارد. مثلا میتواند عکسها، فایلهای اسکریپت و … موجود در یک صفحه را با همان اتصال اولیه دریافت کند. لذا سرعت آن به دلیل حذف شدن برقراری ارتباط مجدد TCP نسبت به نسخهٔ ۱٫۰ افزایش یافته است.
جلسه
در پروتکل انتقال ابرمتن به دنبالهای از درخواستها و پاسخها جلسه (به انگلیسی: (Session) گفته میشود. کلاینت با ایجاد یک اتصال هدایت انتقال (TCP)بر روی یک درگاهِ از پیش تعیین شده بر روی سرور ( معمولا درگاه شماره ۸۰؛ فهرست عددهای درگاه تیسیپی و یودیپی )، جلسه را آغاز میکند. سرور وب همواره بر روی درگاه در انتظار درخواستهای کلاینتها میباشد. بعد از دریافت درخواست ارسال شده، سرور با ارسال یک خط وضعیت (به انگلیسی: Status Line) و بدنه، پاسخ کلاینت را به او بازمیگرداند. بدنه بستهٔ پاسخ معمولاً حاوی منبع درخواست شده است؛ با این حال از آن برای ارسال خطا و اطلاعات دیگر نیز استفاده میشود.
یک نمونه از خط وضعیت در پاسخ به یک درخواست مجاز:HTTP/1.1 200 OK
روشهای درخواست
پروتکل انتقال ابرمتن روشهایی را برای درخواست تعریف کرده است (به انگلیسی: (Request Method)که هر کدام از آنها باعث انجام عمل خاص در سمت سرور میشوند. نسخهٔ ۱٫۰ روشهای درخواست GET، POST و HEAD را دارا بود. در نسخهٔ ۱٫۱ پنج روش جدید افزوده شد: OPTIONS، PUT، DELETE، TRACE و CONNECT. از آنجایی که عملکرد این روشها به طور کامل تعریف و شرح داده شده است، لذا تمامی مرورگر هاو سرور ها به راحتی میتوانند این روشها را پیادهسازی و استفاده نمایند. اگر روشی برای سرور تعریف نشده باشد، با آن به عنوان یک روش غیرِامن برخورد خواهد کرد. در تعداد روشها هیچ محدودیتی وجود ندارد. این نکته باعث میشود که گسترش احتمالی این پروتکل در آینده به زیرساختها فعلی آن آسیبی نرساند و آنها را تغییر ندهد. برای مثال در حال حاضر پروتکل WebDAV هفت روش جدید درخواست را تعریف کرده است.
GET
درخواست نمایش منبعِ درخواستدادهشده را میدهد. (این منبع معمولا یک فایل یا پروندهمیباشد.) این روش فقط اطلاعات را از سرور دریافت میکند و نباید هیچ تاثیری بر روی منابع سرور بگذارد.
HEAD
این روش دقیقا مانند روش GET عمل میکند با این تفاوت که بدنه پاسخ را نمیخواهد. از این روش برای بهدستآوردن فرادادههایموجود در سرآیند (به انگلیسی: Header) استفاده میشود. یکی از استفادههای رایج این نوع درخواست، بررسی تغییر یافتن یک منبع است.
POST
در این روش به همراه بستهٔ درخواست اطلاعاتی نیز فرستاده میشود. سرور با توجه به نشانی وب (URL) درخواست شده و اطلاعات ارسال شده، منبع مورد نظر را در بستهٔ پاسخ برمیگرداند. این اطلاعات ارسالی میتواند نامِکاربری و کلمهٔعبور، یک نظر بر روی یک مطلب و یا اطلاعات هر فرم دیگری که توسط کاربر وارد شده است، باشد.
PUT
در این روش منبعی به همراه بستهٔ درخواست ارسال شده و از سرور تقاضا میشود که این منبع را در آدرسموجود در بسته بارگذاریکند. اگر در محلِ درخواست شده قبلا منبع دیگری قرار داشته باشد، منبع جدید جایگزین خواهد شد.
DELETE
از سرور درخواست میکند که آدرسفرستاده شده را حذف نماید.
TRACE
در این روش سرور اطلاعات ارسال شده را عیناً به کلاینت باز میگرداند. (برای بررسی تغییراتی که واسطهای شبکه بر روی بسته میگذارند، از این روش استفاده میشود.)
OPTIONS
از سرور تقاضا میکند تا روشهای درخواستِ (به انگلیسی: Request Method) موجود برای نشانیفرستاده شده را اعلام نماید. برای گرفتن تمامی روشهای درخواست قابل اجرا بر روی سرور میتوان از نشانی ‘*’ استفاده کرد.
CONNECT
بستهٔ پروتکل ابرمتن را به یک تونل TCP/IP تبدیل میکند. این عمل معمولاً برای برقراری ارتباط امن (HTTPS) بر روی یک پراکسی سرورناامن استفاده میشود.
PATCH
این روش که در سال ۲۰۱۰ به پروتکل افزوده شد، برای ایجاد تغییرات جزیی بر روی منابع استفاده میشود.
سرورهای وب موظف هستند حداقل روشهای GET و HEAD را پیادهسازی نمایند.
وضعیت جلسه
پروتکل انتقال ابرمتن یک پروتکل Stateless میباشد. بدین معنی که سرور در یک جلسه هیچ ردی از کاربر ذخیره نمیکند. به طور مثال، سرور وب هیچگاه نمی تواند به یاد بیاورد که شما در این وبسایت لاگین کردهاید یا نه! اما به دلیل نیاز شدید نرمافزار های تحت وب به ثبت وضعیت، با استفاده از تکنیکها زیر این عمل انجام میگیرد:
1.کوکی
2.استفاده از متغیر های پنهان در فرمهای وب
3.استفاده از متغیر های موجود در رشته درخواست. مانند: index.php?session_id=some_unique_id
کدهای وضعیت
از نسخهٔ ۱٫۰ پروتکل انتقال ابرمتن به بعد، خطِ اولِ پاسخِ سرور تحت عنوان خط وضعیت شناخته شده است. این خط حاوی یک کد عددی (مانند ۴۰۴) که به عنوان کد وضعیت شناخته میشود و یک پیام متنی (مانند “یافت نشد” یا “Not Found”) که با عنوان علت وضعیت شناخته میشود، میباشد. نحوهٔ برخورد عامل کاربربا پاسخ، بستگی کامل به کد وضعیت و فیلدهای سرآیند بستهٔ پاسخ دارد. با این حال استفاده از کدهای سفارشی (که در پروتکل اصلی موجود نیستند) نیز بلامانع میباشد. زیرا عوامل کاربر در برخورد باکدهای تعریف نشده، از رقم اول عدد آنها برای شناسایی نوع کلی کد استفاده میکنند. کدهای وضعیت پروتکل انتقال ابرمتن به ۵ دستهٔ کلی تقسیم میشوند:
کدهای 1xx یا اطلاعاتی: این کدها با عدد ۱ آغاز میشوند. این گروه، این پیام کلی را مشخص میکنند: «درخواست شما دریافت شد، ادامه دهید.
کدهای 2xx یا موفقیت: این کدها با عدد ۲ آغاز میشوند. یعنیدرخواستِ ارسالی دریافت شده، درک شده، پذیرفته شده و با موفقیت انجام شده است.
کدهای 3xx یا تغییر مسیر: این کدها با عدد ۳ آغاز میشوند. یعنیکلاینت برای کامل شدن درخواست نیازمند انجام عملیات اضافی است.
کدهای 4xx یا خطای کلاینت: این کدها با عدد ۴ آغاز میشوند. این گروه از کدها مشخص میکنند کهکلاینت در درخواست خود اشتباه کرده و یا باعث بروز خطا شده است.
کدهای 5xx یا خطای سرور: این کدها با عدد ۵ آغاز میشوند. با این مفهوم کهسرور در انجام عملیات مربوط به یک بستهٔ درخواستِ ظاهراً صحیح، ناموفق بوده و با خطا مواجه شده است.
علت وضعیت هایی که در متن تعریف پروتکل آمدهاند پیشنهادی بوده و میتوانند با متون دیگر، به صلاحِ دید توسعه دهنده، تغییر پیدا کنند. این عبارت میتواند توسط عامل کابربه عنوان توضیحات اضافی به کاربر نمایش داده شود.
مثال
در زیر مثالی از یک جلسهبین یک کلاینت HTTP و یک سرور HTTP که بر روییwww.cisco2016.blogfa.com قرار دارد، ارائه شده است.
درخواست کلاینت GET /index.html HTTP/1.1 Host: www. cisco2016.blogfa.com
در درخواست کلاینت، خط اول روش، نشانیو نسخهٔ پروتکل استفاده شده در درخواست را مشخص میکند. از خط دوم هر خط حاوی یک فیلد سرآیند (به انگلیسی: Header Field) میباشد و این فیلدها با یک خط خالی به پایان میرسند. پایان هر خط در این پروتکل با ۲ حرف Carriage Return و Line Feed پشتِسرهم مشخص میشود. (r\n\)
پاسخ سرور
HTTP/1.1 200 OK
Date: Mon, 23 May 2005 22:38:34 GMT
Server: Apache/1.3.3.7 (UNIX) (Red-Hat/Linux)
Last-Modified: Wed, 08 Jan 2003 23:11:55 GMT
Content-Type: text/html; charset=UTF-8
Content-Length: 131
Connection: close
An Example Page
Hello World, this is a very simple HTML document.
در پاسخ سرور، خط اول، که خط وضعیت نامیده میشود، یکی از وضعیتهای تعریف شده در پروتکل را مشخص میکند. در اینجا کد وضعیت ۲۰۰ به معنای صحیح و مجاز بودن درخواست میباشد. از خط دوم، هر خط حاوی یک فیلد سرآیند (به انگلیسی: Header Field) پاسخ است. این فیلدها با یک خط خالی به پایان میرسند. پایان هر خط نیز مانند بستهٔ درخواست با ۲ حرف Carriage Return و Line Feed پشتِسرِهم مشخص میشود. بعد از یک خط خالی (که به معنای پایان فیلدهای سرآیند است)، بدنه پاسخ آغاز میشود. طول بدنهٔ پاسخ معمولاً در فیلد سرآیند Content-Length توسط سرور مشخص میشود. در صورتی که این فیلد مشخص نشود، اطلاعات ارسالی تا بسته شدن کامل ارتباط، بدنهٔ پاسخ محسوب خواهند شد.