Адрес сайта википедия: HTTP 429 — too many requests, слишком много запросов

Можно ли доверять Википедии: мнения экспертов

Фото: «Мир Белогорья»

Белгород / Михаил Перетокин, Юлия Ковалевская / 15.01.2021 15:22

Википедии – 20 лет. Сегодня свой день рождения отмечает, пожалуй, самый популярный интернет-ресурс в мире. По своему объему Википедия считается самой полной энциклопедией за всю историю человечества: в ней содержатся более 40 миллионов статей на 301 языке. Мы собрали для вас пул мнений от специалистов о том, можно ли полностью доверять сведениям в этом источнике, как работает всемирная народная энциклопедия, в чем ее плюсы и минусы в сравнение с классическими фундаментальными изданиями.

Если сегодня информация о чем-либо есть в Википедии, она однозначно попадает в топ-10 поисковика. Главные принципы работы интернет-энциклопедии – открытость и простота. Контент создают сами пользователи, численность которых по всему миру уже превышает пять миллионов. Чтобы написать статью, даже авторизация не нужна. Достаточно знать язык вики-разметки. Однако статью могут не принять. Если сведения вызывают сомнения в абсолютной достоверности со стороны остального вики-сообщества.

«Было проведено исследование, сравнивали, правда, англоязычные материалы. В британской энциклопедии насчитывали до трех ошибок в статьях. Википедия была сравнима с ней. А в ненаучных изданиях были случаи и до пяти ошибок. Википедия в этом случае более точна. Она характеризует мнение большинства в данный момент. Ей можно доверять. В частности, я сам пользуюсь Википедией. Когда мне надо быстро составить представление об объекте, я первым делом открываю ее, чтобы понять, что да как. Ограниченные параметры. А дальше уже принимаю решение, копать глубже, смотреть больше или нет», – рассказал заместитель директора центра образования №15 «Луч» Роман Ушаков.

Вместе с нашим первым спикером «копать глубже» решили и мы. Чаще всего к Википедии прибегают школьники и студенты, они опираются на материалы энциклопедии, чтобы получить общее понимание о предмете, явлении, факте без каких-либо оценочных суждений.

Мы обратились за комментариями к преподавателям университета, чтобы узнать, что они думают о таком подходе И оказалось, что некоторые из них, планируя деятельность своих подопечных, сами зачастую рекомендуют использовать интернет-энциклопедию, как опорный фундамент для дальнейшего поиска информации.

«Я считаю, что Википедии на данный момент можно доверять. Особенно студенты младших курсов. Это первый источник, который они используют для своей научной работы исследовательской, для написания рефератов. Интернет-ресурс – это сейчас первый ресурс, который используют студенты. И, естественно, на любую научную тематику, о которой они пытаются найти информацию, открывается именно этот ресурс, и они его используют. Студенты старших курсов и магистранты более детально подходят к изучению информации, могут использовать более сложные источники информации, более проработанные, но Википедию они также используют, но уже с какой-то проработкой данного материала более детально, с проверкой необходимой информации», – рассказала доцент кафедры института наук о земле НИУ «БелГУ», начальник отдела научно-исследовательской работы студентов и молодых ученых, кандидат географических наук Ярослава Павлюк.

Авторы, создающие контент для Википедии, зачастую далеки от научной сферы. Поэтому организовать их работу по корректному написанию статей, привязке ссылок на источники очень важно. Системную оценку такому ресурсу, как Википедия, и его перспективности, дал профессор кафедры мировой экономики БелГУ Владимир Московкин.

«У нас в России идет критика этого проекта. Я вообще не вижу у него никаких минусов. Когда работают энтузиасты, волонтеры без всякого денежного вознаграждения по всему миру, они делают качественный продукт, который можно использовать в образовании, и надо этим заниматься и обучать преподавателей наших. А как это сделать – с помощью семинаров, которые проводит российское Викимедиа. В науке надо активно использовать, при написании обзоров, особенно тем, кто любит работать с Google. И надо использовать в библиотечном деле. Библиотеки сейчас деградируют, но могут подняться с помощью Википедии. Обязательно должна быть работа. Вот три направления: библиотечный менеджмент, университетское обучение и исследования», – поделился профессор кафедры мировой экономики института экономики и управления НИУ «БелГУ», доктор географических наук, директор центра развития публикационной активности Владимир Московкин.

После такого комментария мы не могли не дать слово представителю библиотечного сообщества. И обратились к сотруднику научной библиотеки Белгородского государственного университета.

Оказалось, что классические словари не очень удачно конкурируют с электронной энциклопедией. К печатным энциклопедическим источникам современные студенты обращаются все реже. Это факт, озвученный библиотекарем. Однозначное предпочтение отдается быстрому поиску информации в интернете. Ссылки на Википедию встречаются даже в исследовательских работах аспирантов. Это во многом объясняется тем, что информация в общедоступной интернет-энциклопедии постоянно актуализируется.

«Из недостатков. Не всегда развернутые ответы в Википедии приводятся. Кроме того, это же ресурс, который создается любым пользователем. Поэтому достоверность сведений, представленных в Википедии, обязательно нужно проверить, если я ищу какой-то достоверный ответ. Ей нельзя пользоваться в качестве единственного источника. Можно проверять фактографию по Википедии, она, как правило, совпадает. Но какое-то углубленное исследование по ней проводить нельзя, нужно пользоваться дополнительными сведениями», – отметила главный библиограф научно-библиографического консультационного центра научной библиотеки имени Страхова НИУ «БелГУ» Наталья Чёрная.

Вывод: Википедии доверяй, но проверяй. Особенно, что касается социально-политических, исторических, культурологических сфер, биографий и совершенно новых, малоизвестных явлений. Ведь она не имеет года издания и точного списка редакторского состава. Это постоянно изменяющийся ресурс. Чтобы проверить факты – используйте правило трех: найдите еще пару-тройку источников с конкретным автором, редактором или рецензентом. И тогда можно быть уверенным в достоверности информации.

 

адрес | это… Что такое Веб-адрес?

Структура URL

Изначально локатор URL был разработан как система для максимально естественного указания на местонахождения ресурсов в сети. Локатор должен был быть легко расширяемым и использовать лишь ограниченный набор пробел никогда не применяется в URL). В связи с этим, возникла следующая традиционная форма записи URL:

<схема>://<логин>:<пароль>@<хост>:<порт>/<URL‐путь>

В этой записи:

схема 
схема обращения к ресурсу, в большинстве случаев имеется в виду сетевой протокол
логин 
имя пользователя, используемое для доступа к ресурсу
пароль 
пароль, ассоциированный с указанным именем пользователя
хост 
полностью прописанное доменное имя хоста в системе IP-адрес хоста в форме четырёх десятичных чисел, разделённых точками. Числа находятся в интервале от 0 до 255.
порт 
порт хоста для подключения
URL-путь 
уточняющая информация о месте нахождения ресурса (зависит от протокола)

Схемы (протоколы) URL

Общепринятые схемы (протоколы) URL включают:

  • ftp — Протокол передачи файлов гипертекста HTTP, использующая шифрование (как правило, TLS)
  • gopher — Протокол Gopher
  • mailto — Адрес электронной почты
  • news — Новости Usenet через протокол IRC
  • prospero — Служба каталогов Prospero Directory Service
  • telnet — Ссылка на интерактивную сессию WAIS
  • xmpp — Протокол XMPP (часть файла
  • data — Непосредственные данные (Data: URL)

Экзотические схемы URL:

  • afs — Глобальное имя файла в файловой системе Andrew File System
  • cid — Идентификатор содержимого для частей
  • mailserver — Доступ к данным с почтовых серверов
  • nfs — Имя файла в сетевой файловой системе NFS
  • tn3270 — Эмуляция интерактивной сессии
  • z39. 50 — Доступ к службам ANSI Z39.50
  • skype — Протокол SMS в некоторых мобильных телефонах
  • ed2k — Файлообменная сеть eDonkey, построенная по принципу P2P

Кодирование URL

Появление адресов URL стало существенным нововведением в Интернете. Однако с момента его изобретения и по сей день стандарт URL обладает серьёзным недостатком — в нём можно использовать только ограниченный набор символов, даже меньший, нежели в кириллицы, или иероглифы, или, скажем, специфические символы французского языка, то нужные нам символы должны быть перекодированы особым образом.

В русскоязычной Википедии ежедневно приходится видеть пример кодирования URL, поскольку русский язык использует символы кириллицы. Например, строка вида:

http://ru.wikipedia.org/wiki/Микрокредит

кодируется в URL как:

http://ru.wikipedia.org/wiki/%D0%9C%D0%B8%D0%BA%D1%80%D0%BE%D0%BA%D1%80%D0%B5%D0%B4%D0%B8%D1%82

Такое преобразование происходит в два этапа: сначала каждый символ кириллицы кодируется в Юникоде (шестнадцатеричном представлении:

М → D0 и 9C → %D0%9C
и → D0 и B8 → %D0%B8
к → D0 и BA → %D0%BA
р → D0 и 80 → %D0%80, и т.    `   {   |   }  <пробел>
%22 %23 %25 %26 %27 %2a %2c %3a %3b %3c %3e %3f %5b %5e %60 %7b %7c %7d   +[3]

Поскольку такому преобразованию подвергаются буквы всех алфавитов, кроме базовой латиницы, то URL со словами на подавляющем большинстве языков (кроме английского, итальянского, латинского) может утратить способность восприниматься людьми.

Это всё входит в противоречие с принципом интернационализма, провозглашаемого всеми ведущими организациями Интернета, включая W3C и англ. International Resource Identifier) — международных идентификаторов ресурсов, в которых можно было бы без проблем использовать символы Юникода, и которые поэтому не ущемляли бы права других языков. Хотя заранее сложно сказать, смогут ли когда‐либо идентификаторы URI в целом).

Инициатива PURL

Ещё один кардинальный недостаток URL состоит в отсутствии гибкости. Ресурсы во Всемирной паутине и Интернете перемещаются, а ссылки в виде URL остаются, указывая на уже отсутствующие ресурсы. Это особенно болезненно для электронных библиотек, каталогов и энциклопедий. Для решения этой проблемы были предложены постоянные локаторы англ. Persistent Uniform Resource Locator). В сущности это те же URL, но они указывают не на конкретное место расположения ресурса, а на запись в базе данных PURL, где, в свою очередь, записан уже конкретный URL‐адрес ресурса. При обращении к PURL сервер находит нужную запись в этой базе данных и перенаправляет запрос уже на конкретное местоположение ресурса. Если адрес ресурса меняется, то нет нужды исправлять все бесчисленные ссылки на него — достаточно лишь изменить запись в БД. В настоящий момент эта идея не стандартизирована и не имеет широкого распространения.

Примеры URL

http://ru.wikipedia.org/wiki/URL
http://en.wikipedia.org:80/wiki/Special:Search?search=train&go=Go 
ftp://myname:[email protected]:21/etc/motd
prospero://myhost.dom//pros/somename
file://vms.myhost.edu/disk$user/my/notes/note123.txt

См.

также

  • PURL
  • IRI — интернационализированный идентификатор ресурса
  • Длинные доменные имена
  • Человеку Понятный URL

Сноски

  1. RFC 2396 часть 2.
  2. 1 2 3 4 5 6 Символ допустим, но при указании прямым текстом несёт специальное синтаксическое значение
  3. Следует отметить, что поисковики заменяют пробел на символ «+».

Ссылки

  • RFC 1738
  • RFC 1630
  • Кодирование URL
  • URLEncode Code Chart — таблица кодирования символов URL

python — Как взять собранные URL-адреса Википедии и поместить их в файл CSV с заголовками source_url, link_url, link_title?

Задавать вопрос

спросил

Изменено
1 год, 1 месяц назад

Просмотрено
194 раза

Таким образом, приведенный ниже код использовался для извлечения URL-адресов из страниц Википедии. Моя цель состояла в том, чтобы начать со страницы википедии «https://en.wikipedia.org/wiki/Wikipedia:Most-referenced_articles» и собрать 10 уникальных ссылок на страницы с этой веб-страницы, которые также относятся к википедии. Оттуда я хотел выбрать одну ссылку из того, что я собрал на первой странице, и очистить эту страницу для еще 10 уникальных ссылок в википедии и повторять этот процесс, пока у меня не будет по крайней мере 100 уникальных ссылок с 10 разных страниц вики. Затем я хотел поместить то, что я собрал, в файл CSV, где собранные данные помещаются в заголовки исходного URL-адреса, URL-адреса ссылки и заголовка ссылки.

Я не знаю, как это сделать, так как я новичок в использовании python. В приведенном ниже коде мне удалось собрать данные и поместить их в файл CSV, но я не знаю, как получить данные, которые будут назначены трем заголовкам исходного URL-адреса, URL-адреса ссылки и заголовка ссылки в файле CSV. .

 из импорта bs4 BeautifulSoup
запросы на импорт
импортировать повторно
импортировать панд как pd
определение is_valid (url):
    если адрес:
        если url. startswith('/wiki/'):
            если нет re.compile('/\w+:').search(url):
                вернуть Истина
    вернуть ложь
starter_url = 'https://en.wikipedia.org/wiki/Википедия:Статьи, на которые ссылаются больше всего'
г = запросы.получить(starter_url)
print('url:', р.url)
суп = BeautifulSoup(r.text, 'html.parser')
title = суп.найти('h2', {'класс': 'первыйЗаголовок'})
print('начальный сайт:', r.url)
печать('название:', title.text)
Распечатать()
действительные_urls = []
для ссылки в soap.find_all('a'):
    url = link.get('href', '')
    если URL не указан в valid_urls и is_valid(url):
        valid_urls.append(url)
print('\n'.join(valid_urls))
df = pd.DataFrame(valid_urls)
df.to_csv('WebCrawler.csv', кодировка='utf-8')
 9="/вики/"]')):
    data.append({
        'исходный URL': starter_url,
        'исходное название':название,
        'адрес ссылки': ссылка['href'],
        'название ссылки':link.text
    })
 

Примечание Не был уверен, какой текст ссылки вы хотите назначить, поэтому я использовал оба, просто чтобы показать, как это работает, просто пропустите тот, который вам не нужен

Пример
 из bs4 import BeautifulSoup
запросы на импорт
импортировать панд как pd
starter_url = 'https://en. ="/wiki/"]')):
    data.append({
        'исходный URL': starter_url,
        'исходное название':название,
        'адрес ссылки': ссылка['href'],
        'название ссылки':link.text
    })
pd.DataFrame(данные)#.to_csv('WebCrawler.csv', encoding='utf-8')
 
Выход

исходный URL исходное название URL ссылки заголовок ссылки
https://en.wikipedia.org/wiki/Wikipedia:Most-referenced_articles Википедия:Самые цитируемые статьи /wiki/History_of_the_National_Register_of_Historic_Places История Национального реестра исторических мест
https://en.wikipedia.org/wiki/Wikipedia:Most-referenced_articles Википедия:Самые цитируемые статьи /wiki/1950_United_States_Census 1950_United_States_Census
https://en.wikipedia.org/wiki/Wikipedia:Most-referenced_articles Википедия:Самые цитируемые статьи /вики/1959 1959
https://en. wikipedia.org/wiki/Wikipedia:Most-referenced_articles Википедия:Самые цитируемые статьи /wiki/Special:UncategorizedTemplates Шаблоны без категорий
https://en.wikipedia.org/wiki/Wikipedia:Most-referenced_articles Википедия:Самые цитируемые статьи /wiki/Special:WhatLinksHere/1790_United_States_Census 297 ссылок
https://en.wikipedia.org/wiki/Wikipedia:Most-referenced_articles Википедия:Самые цитируемые статьи /wiki/Специальный: WhatLinksHere/1882 720 ссылок
https://en.wikipedia.org/wiki/Wikipedia:Most-referenced_articles Википедия:Самые цитируемые статьи /wiki/Пользователь: Рэмбот Пользователь: Рэмбот
https://en.wikipedia.org/wiki/Wikipedia:Most-referenced_articles Википедия:Самые цитируемые статьи /вики/1981 1981
https://en. wikipedia.org/wiki/Wikipedia:Most-referenced_articles Википедия:Самые цитируемые статьи /wiki/Special:WhatLinksHere/1960_United_States_Census 5355 ссылок

Зарегистрируйтесь или войдите в систему

Зарегистрируйтесь с помощью Google

Зарегистрироваться через Facebook

Зарегистрируйтесь, используя электронную почту и пароль

Опубликовать как гость

Электронная почта

Обязательно, но не отображается

Опубликовать как гость

Электронная почта

Требуется, но не отображается

.

wiki — Top Level Design

Вики — это центры совместной работы.

Вики — это сетевая публикация, совместно редактируемая и управляемая собственной аудиторией и обычно управляемая с использованием технологии вики. Вики — это объединяющая сила для людей со схожими интересами, а доменное имя .wiki побуждает к совместной работе на вашем веб-сайте.

Пусть люди знают, что ваш сайт — это место, где они могут узнать больше о своем хобби, игре или любимом проекте, или создать памятный дом для корпоративных знаний с помощью домена .wiki для вашего бизнеса.

Домен .wiki — это призыв к поиску и обмену информацией. Начните сотрудничать с .wiki сегодня.

купить домены .WIKI

Способы использования .wiki:

  • Хобби

  • Игры

  • Фэндом

  • Образование

  • Бизнес

  • Техника

Файлы логотипов

Скачать логотипы . WIKI

Краткий обзор целевых рынков

Технически подкованные 

Поскольку домен .wiki обычно подразумевает, что на сайте установлено программное обеспечение wiki, мы считаем, что средний пользователь .wiki, как правило, лучше разбирается в Интернете, чем владелец регистрации стандартного домена. Это означает, что у .wiki есть техническая и активная онлайн-аудитория, и их интересы часто связаны с конкретными областями, такими как научные круги, фэндомы или технологии.

Общие энтузиасты

Wikipedia.org неизменно считается одним из самых важных и посещаемых веб-сайтов в мире. Многие люди ассоциируют термин «вики» со знаниями и авторитетом, хотя некоторые люди могут еще не понимать, что Википедия — не единственная вики. Полезно информировать людей о том, что сайты в .wiki могут быть посвящены любой заданной теме и даже не должны запускать программное обеспечение вики.

Вики для компаний

Существует много примеров компаний, как крупных, так и малых, размещающих свои частные внутренние вики на интуитивно понятном и запоминающемся доменном имени . wiki. У большинства компаний есть вики или аналогичный источник для каталогизации и доступа к внутренним бизнес-знаниям, но часто эти сайты настроены с неясными URL-адресами, которые трудно запомнить. Использование .wiki для размещения или перенаправления на внутреннюю вики является интуитивно понятным решением.

Копирование и обмен сообщениями

Buzz Words

Short Copy

Вики и вики-технологии используются некоторыми из самых популярных веб-сайтов в мире, причем Википедия является наиболее известным примером, поэтому домен .wiki занимает выгодное положение. чтобы не только обозначить вики-технологию, но и сообщить вашей аудитории, что они могут ожидать от вашего веб-сайта.

Домен .wiki помогает любому представить себя серьезным энтузиастом при использовании в своем URL-адресе или адресе электронной почты.

Полная копия

Вики и вики-технологии используются некоторыми из самых популярных веб-сайтов в мире, причем Википедия является наиболее известным примером, поэтому домен .