فهرست مطالب

زمانی که در زمینه علوم کامپیوتر کار می کنیم اغلب با اصطلاح «پروکسی» مواجه می شویم. هنگامی که به اینترنت متصل می شود، هر رایانه یک آدرس پروتکل اینترنتی منحصر به فرد (IP) دریافت می کند که رایانه و موقعیت جغرافیایی آن را مشخص می کند. کامپیوتر شما هر زمان که نیاز به اطلاعاتی از اینترنت داشته باشد درخواستی را ارسال می کند. درخواست به یک کامپیوتر هدف ارسال می شود که نوع اطلاعات درخواست شده را بررسی می کند. کامپیوتر هدف اگر اجازه داده شود اطلاعات را به آدرس IP ما بدهد، آن را پس می فرستد. گاهی اوقات، رایانه می خواهد اطلاعات را بدون شناسایی از اینترنت دریافت کند. این اطلاعات معمولاً مسدود می‌شوند، اما ما می‌توانیم آن‌ها را با استفاده از یک پروکسی دریافت کنیم که به عنوان واسطه بین مشتری و ماشین سرور عمل می‌کند. فیلد شناسایی بین کامپیوتر مشتری و اینترنت.

سرورهای پروکسی با نگرانی فزاینده امنیت آنلاین و سرقت داده ها بسیار محبوب شده اند. در اینجا این سوال پیش می آید که چگونه پروکسی سرور به امنیت سیستم ما متصل می شود؟ می توان گفت که یک سرور پروکسی یک سطح امنیتی اضافی بین سرور ما و دنیای خارجی اضافه می کند. این امنیت اضافی به حفظ سیستم ما در برابر نفوذ کمک می کند.

برای استفاده از پراکسی ها با درخواست های پایتون، باید مراحل زیر را دنبال کنید. شما به راحتی می توانید درخواست ها را از طریق این بسته بدون افزودن دستی رشته های پرس و جو به URL های خود ارسال کنید. می‌توانید درخواست‌ها را با استفاده از دستور زیر وارد کنید. می‌توانید به متغیر فرهنگ لغت هر نامی مانند «پراکسی» بدهید که پروتکلی را به URL پراکسی نگاشت می‌کند. علاوه بر این، شما باید متغیر URL را روی وب‌سایتی که باید از آن خراش دهید، تنظیم کنید.

proxies = {
  "http":"http://203.190.46.62:8080"،
  "https":"https://111.68.26.237:8080"
}
url = 'https://httpbin.org/ip'

در اینجا فرهنگ لغت URL پروکسی را برای دو پروتکل جداگانه یعنی HTTP و HTTPS تعریف می‌کند.

یک متغیر پاسخ ایجاد کنید

شما باید یک پاسخ ایجاد کنید. متغیری که از هر یک از روش های درخواست استفاده می کند. این روش دو آرگومان می‌گیرد:

  • URL که ایجاد کردید
  • فرهنگ لغت که تعریف کردید
response = prosl.xies(url = pro.xies)
print(response.json())

خروجی به صورت زیر است:

روش درخواست

تعدادی روش درخواستی وجود دارد مانند:

  • GET –[1945900] اطلاعات داده شده مجدد از atris. سرور با استفاده از یک URL داده شده
  • POST – این روش درخواست می‌کند که وب سرور داده شده داده‌های محصور شده در بدنه پیام درخواست را بپذیرد تا آن را ذخیره کند. داده ها تحت URL داده شده ذخیره می شوند.
  • DELETE – این روش یک درخواست DELETE را به URL داده شده ارسال می کند. و تغییرات جزئی در یک منبع موجود ایجاد می کند.
  • HEAD – زمانی که شما به محتوای فایل نیاز ندارید و فقط هدرهای HTTP یا status_code را می‌خواهید، درخواست HEAD را به URL داده شده ارسال می‌کند.

می‌توانید از دستور زیر برای درخواست‌ها استفاده کنید. زمانی که URL مشخص شده باشد. در اینجا، URL ما همان است که در کد بالا i-e.، https://httpbin.org/ip استفاده کردیم.

response = requests.get(url)
answer = requests.post(url, data={"a": 1, "b": 2})
پاسخ = requests.put(url)
پاسخ = requests.delete(url)
پاسخ = requests.patch(url)
پاسخ = requests.head(url)
answer = requests.options(url)

جلسات پروکسی

اگر می‌خواهید داده‌های وب‌سایت‌هایی را که از جلسات استفاده می‌کنند پاک کنید، می‌توانید مراحل زیر را دنبال کنید. ]کتابخانه درخواست‌ها.

درخواست‌های وارد کردن

مرحله شماره 02

با ایجاد یک متغیر session و تنظیم آن بر روی متغیر session[19459006)وتنظیمآنبررویمتغیر[0949455555]، یک شی جلسه ایجاد کنید. ] روش.

session = requests.Session()

session.proxies = {
   'http': 'http://10.10.10.10:8000'،
   'https': 'http://10.10.10.10:8000'،
}

url = 'http://mywebsite.com/example'

Step#03

پراکسی های جلسه را از طریق روش درخواست ها ارسال کنید و URL را به عنوان آرگومان ارسال کنید.

response=response .get(url)

بیایید دو نوع اصلی پراکسی را مورد بحث قرار دهیم، به عنوان مثال؛

  1. پراکسی‌های استاتیک
  2. پراکسی‌های چرخشی

پروکسی‌های چرخشی

6 پروکسی‌ها می‌توانیم[09]Static مرکز داده پروتکل های اینترنت اختصاص داده شده از طریق یک قرارداد ارائه دهنده خدمات اینترنت (ISP). آنها طوری طراحی شده اند که برای مدت زمان مشخصی به یک سرور پراکسی متصل بمانند. نام "static" نشان می‌دهد که به ما اجازه می‌دهد تا زمانی که لازم است به عنوان یک کاربر مسکونی با همان IP کار کنیم.

به طور خلاصه، با استفاده از پراکسی های ثابت، سرعت پراکسی های مرکز داده و ناشناس بودن بالای پراکسی های مسکونی را دریافت می کنیم. علاوه بر این، یک پروکسی استاتیک به ما امکان می دهد از چرخش آدرس IP جلوگیری کنیم و استفاده از آن را به طور قابل توجهی ساده تر می کند. این پروکسی‌ها که به نام آدرس‌های IP چسبنده نیز شناخته می‌شوند، تقریباً برای همه وب‌سایت‌ها مانند مصرف‌کنندگان واقعی به نظر می‌رسند.

پراکسی های چرخشی

ما می توانیم چرخش پروکسی را به عنوان ویژگی تعریف کنیم که آدرس IP ما را با هر درخواست جدیدی که ارسال می کنیم تغییر می دهد. ، از جمله آدرس IP ما. به عنوان مثال، هنگامی که داده ها را با استفاده از یک اسکراپر (برای تولید سرنخ) جمع آوری می کنیم، چنین درخواست هایی را ارسال می کنیم. بنابراین، سرور مقصد مشکوک می شود و زمانی که بیشتر درخواست ها از همان IP می آیند، آن را ممنوع می کند.

بنابراین، باید راه حلی برای تغییر آدرس IP ما با هر درخواستی که ارسال می کنیم وجود داشته باشد. آن راه حل یک پروکسی چرخشی است. بنابراین، برای جلوگیری از دردسر بیهوده برای تهیه یک اسکراپر برای چرخاندن IPها در اسکراپینگ وب، می‌توانیم پراکسی‌های چرخشی دریافت کنیم و به ارائه‌دهنده خود اجازه دهیم چرخش را انجام دهد.

دلایل استفاده از انواع مختلف پروکسی‌ها در زیر آمده است. مدیران رسانه های اجتماعی از پروکسی ها قدردانی می کنند که به آنها اجازه می دهند به یک سرور واحد بچسبند. اگر کاربران دائماً با تغییر آدرس‌های IP وارد حساب‌های خود شوند، پلتفرم رسانه‌های اجتماعی مشکوک شده و نمایه آنها را مسدود می‌کند.

  • سایت‌های تجارت الکترونیک ممکن است داده‌های متفاوتی را برای کاربران مکان‌های دیگر و بازدیدکنندگان بازگشتی نشان دهند. همچنین، اگر خریدار چندین بار از آدرس‌های IP مختلف وارد حساب کاربری خود شود، سرور هشدار می‌دهد. بنابراین، ما باید از پراکسی‌ها برای خرید آنلاین استفاده کنیم.
  • زمانی که یک متخصص می‌خواهد داده‌های مورد نیاز را از چشم کاربر از یک مکان بررسی کند، به پروکسی برای تحقیقات بازاریابی دستی نیاز داریم.
  • راستی‌آزمایی آگهی به تبلیغ‌کنندگان این امکان را می‌دهد که بررسی کنند آیا تبلیغات آنها در وب‌سایت‌های مناسب نمایش داده می‌شود و توسط مخاطبان مناسب دیده می‌شود. تغییر مداوم آدرس‌های IP به بسیاری از وب‌سایت‌های مختلف دسترسی پیدا می‌کند و بنابراین آگهی‌های بدون بلوک IP را تأیید می‌کند. استفاده از پراکسی ها به ما امکان می دهد بدون توجه به موقعیت جغرافیایی به داده های لازم دسترسی داشته باشیم.
  • ما می‌توانیم از پروکسی‌ها برای دسترسی به داده‌ها استفاده کنیم و سرعت مرور را افزایش دهیم زیرا آنها یک سیستم کش خوب دارند. هر زمان که اطلاعاتی را درخواست می کنید، رایانه شما این درخواست را به پروکسی ارسال می کند، که سپس اطلاعات را با استفاده از یک آدرس IP متفاوت به رایانه مورد نظر ارسال می کند. بنابراین آدرس IP شما محرمانه باقی می ماند. علاوه بر این، می توانید از پروکسی ها با ماژول درخواست ها در پایتون استفاده کنید و بسته به نیاز خود اقدامات مختلفی را انجام دهید. اگر به یک IP ثابت با سرعت پراکسی های مرکز داده و ناشناس بودن بالای پراکسی های مسکونی نیاز دارید، پروکسی های ایستا راه حلی هستند زیرا آدرس IP با هر درخواست جدید بدون تغییر باقی می ماند. در مقابل، پراکسی‌های چرخان مزایایی را در آزمایش و خراش دادن ارائه می‌کنند.