Завсегдатай
![]() ![]() ![]() ![]() |
IT-шники на форуме есть? или "а сделайте выборку по странам..." |
А вот, что-то, зацепила задачка, заданная Дмитрием в теме "Результаты IAPLС 2019" Кашкаров Дмитрий На первый взгляд, вроде, всё просто: 1.Берем PDF http://en.iaplc.com/... 2.Тупо копируем из него всю информацию в Эксель, и дальше делай любые выборки, диаграммы... Но, не тут то было: Из PDF копируется полный фарш, да еще и всё в одну ячейку, а это совсем не ожидаемая таблица... У самого варианты решения есть, но как-то оно совсем не красиво, из серии "правой рукой в левый карман, да еще и со спины и за несколько итераций"... Может, кому еще интересно подумать? |
|
#2665089 |
Модератор , Советник
![]() |
|
AxelV Копируем в текстовый файл, расставляем разделительный символ, например, табуляцию, сохраняем в CSV, импортируем в Excel |
|
#2665090 |
|
Завсегдатай
![]() ![]() ![]() ![]() |
|
Константин Кучеренко Это в теории или ожидаемый результат на практике получен? (просто у меня идея была похожая, но копировал в Word, а далее вышло совсем не то, что ожидал...) |
|
#2665091 |
Завсегдатай
![]() ![]() ![]() ![]() |
|
Кстати, действительно, с сохранением PDF в текст, действительно, геморроя получается поменьше, чем с копированием содержимого из PDF в Word через буфер обмена. |
|
#2665096 |
Свой на Aqa.ru
![]() ![]() ![]() ![]() ![]() |
|
AxelV CSV-файл - это текстовый файл, в котором содержится информация. Каждая строка - это отдельная строка таблицы, а столбцы отделены один от другого специальными символами - разделителями (например, запятой). В последнее время разделителем может быть не только запятая, но и другие символы (пробел, точка с запятой, табуляция, другое). Например, 86;Alexander Maletin;Russia 263;Mikhail Goryaev;Russia 275;Vyacheslav Kryshtopa;Russia 327;Dmitry Parshin;Russia 331;Sergey Lomakin;Russia 336;Oleg Matsevich;Russia 400;Sergey Bezdenezhnykh;Russia 488;Evgeny Sukhorukov;Russia 505;Sergey Lobanov;Russia 841;Aleksandr Boykov;Russia 842;Ilnaz Bilalov;Russia 946;Andrew Amelichev;Russia 983;Rinat Giniyatov;Russia 1077;Ilya Shumilov;Russia 1281;Andrey Zharanov;Russia Его можно открыть в Excel, указав ";" в качестве разделителя. В результате каждая строка будет разложена в три ячейки. |
|
#2665099 |
Завсегдатай
![]() ![]() ![]() ![]() |
|
IgorPriv Либо проблема в дремучем Office 2003, который у меня на домашнем ПК, либо, я просто не понимаю, как в текстовом файле (в который, действительно, можно сохранить из PDF) АВТОМАТИЧЕСКИ расставить эти разделители столбцов. Сейчас вижу в нем только пробелы - а это может быть как признак разделения столбца, так и пробел, разделяющий фамилию и имя, либо название страны из нескольких слов... |
|
#2665102 |
|
Модератор , Советник
![]() |
|
подождите, сейчас все сделаю |
|
#2665104 |
Свой на Aqa.ru, Советник
![]() |
|
Константин Кучеренко Всегда восхищался теми, кто так ловко управляется с компьютерной обработкой информации! |
|
#2665106 |
Завсегдатай
![]() ![]() ![]() ![]() |
|
Константин Кучеренко 1. Спасибо. 2. Результат - то получить я и сам смог, но, как-то совсем криво и наполовину вручную. Больше интересовал нормальный процесс его получения, а здесь у меня какой-то затык... Похоже, старый MS-офис, действительно, многое не может, да и в CSV сохранить тоже... А про два отсутствующих номера, там в конце текста было: *World ranking 1500th and 1515th are vacant numbers. Изменено автор AxelV |
|
#2665107 |
|
Модератор , Советник
![]() |
|
#2665108 Нравится Искатель2.0
|
Свой на Aqa.ru, Советник
![]() |
|
Константин Кучеренко Не очень понял что кроется за этой фразой. Но вот мне совсем не помешали бы эти ЗУНы, да только, видать, туп я в этой области - приходится обращаться к умельцам... |
|
#2665110 |
Модератор , Советник
![]() |
|
Notozus Когда нужно срочно переработать огромный массив плохо структурированных данных, приходится научиться искать закономерности и как-то автоматизировать. Нашел несколько ошибок, исправил: https://cloud.mail.r... Изменено автор Константин Кучеренко |
|
#2665112 |
|
Модератор , Советник
![]() |
|
#2665115 |
Завсегдатай
![]() ![]() ![]() ![]() |
|
Константин Кучеренко Статистика-та она, конечно, вот: Но, интересна была совсем не она, а только способ её получения. ![]() Кстати, а из картинки в *.CSV тоже сможете? ![]() ![]() Изменено автор AxelV |
|
#2665117 |
Модератор , Советник
![]() |
|
AxelV Можно еще получить отношение среднего рейтинга по стране к общему количеству участников из данной страны. |
|
#2665118 |
|
Модератор , Советник
![]() |
|
#2665121 |
Завсегдатай
![]() ![]() ![]() ![]() |
|
Константин Кучеренко Впринципе, средний рейтинг, в данном случае, это что-то не очень информативное (при небольшом количестве участников от страны, попавших в 100: допустим, 2 участника, один занял 1е место, 2й - 99е: в среднем 50е- какой вывод?) да и СРЕДНИЙ рейтинг, как-то нелогично еще раз делить на количество участников. А вот количество участников от страны, попавших в 100, было предложено трактовать, как % продаж в данном регионе. |
|
#2665128 |
|
|
Пару раз перечитал тему: так и не понял чего хотят добиться? AxelV "средний рейтинг" - это наверно как средняя температура по больнице: у кого-то 36и6, у кого-то 34и6 (остывающий труп), у кого-то 38и6(сильный жар) - в среднем 36и6 - все здоровы! |
|
#2665143 |
|
Завсегдатай
![]() ![]() ![]() ![]() |
|
Искатель2.0 Да, вытащить таблицу в эксель, но именно из данного, конкретного PDF по ссылке в 1м посте. Далее, задача автоматически подсчитать количество работ от каждой страны, попавших в 1ю сотню рейтинга, и, если есть желание, еще и средний рейтинг по каждой из этих стран. А сделать сразу в экселе - нельзя, потому, что её уже сделали в PDF. |
|
#2665153 |
Модератор , Советник
![]() |
|
AxelV Но от количества участников это тоже зависит. Тогда наверно показательным будет отношение количества людей, попавших в сотню, к общему количеству участников из данной страны. |
|
#2665162 Нравится AxelV
|
На премодерации
![]() ![]() ![]() ![]() ![]() |
|
64 Юго-Восток и остальные, где очень развита Адская школа, особенно Бразилия.... Ну, что тут скажешь еще..... |
|
#2665168 |
|