Python - пакетное преобразование позиций GPS в десятичные дроби Lat Lon

Привет, у меня есть устаревшая БД с некоторыми позиционными данными. Поля — это просто текстовые поля со строками, подобными этой 0°25'30"S, 91°7'W. Есть ли способ преобразовать их в два числа с плавающей запятой для Decimal Latitude и Decimal Longitude?

РЕДАКТИРОВАТЬ:

Примером может быть: 0°25'30"S, 91°7'W -> 0.425, 91.116667, где исходная позиция в одном поле дает два числа с плавающей запятой.

Любая помощь высоко ценится.


person Darwin Tech    schedule 01.06.2012    source источник
comment
Каким будет соответствующий вывод для предоставленной вами координаты. Кроме того, широта имеет 3 числовых поля, долгота 2 .. это типично для того, как они указаны (и постоянны в ваших данных)? что ты уже испробовал?   -  person Levon    schedule 01.06.2012
comment
Итак, я хочу сгенерировать поплавки: 0°25'30"S, 91°7'W -> 0.425, 91.116667. Похоже, что данные могут быть связаны с минутами, а могут и не быть. Там, где его нет, я могу принять 0.   -  person Darwin Tech    schedule 01.06.2012
comment
Долгота 180 W = -180 180 E = 180 Широта 90 N = 90 90 S = -90 Пример должен давать -0,425, -91,116667. Проверьте это, например, выполнив поиск 0°25'30S, 91°7'W на Картах Google.   -  person Renat Zaripov    schedule 28.02.2014


Ответы (4)


Этот подход может иметь дело с отсутствующими секундами и минутами, и я думаю, что правильно обрабатывает направления компаса:

# -*- coding: latin-1 -*-

def conversion(old):
    direction = {'N':1, 'S':-1, 'E': 1, 'W':-1}
    new = old.replace(u'°',' ').replace('\'',' ').replace('"',' ')
    new = new.split()
    new_dir = new.pop()
    new.extend([0,0,0])
    return (int(new[0])+int(new[1])/60.0+int(new[2])/3600.0) * direction[new_dir]

lat, lon = u'''0°25'30"S, 91°7'W'''.split(', ')
print conversion(lat), conversion(lon)
#Output:
0.425 91.1166666667
person fraxel    schedule 01.06.2012
comment
+1 за то, что у меня не болит голова .. Простое лучше, чем сложное. - person Levon; 01.06.2012
comment
почти идеально... направления меняются местами... direction = {'N':1, 'S':-1, 'E': 1, 'W':-1} - person rom; 11.08.2015
comment
как изменить код для этого 27°29'04.2"N 89°19'44.6"E - person kn3l; 18.07.2019

Это преобразует вашу входную строку в ожидаемый результат. Он может обрабатывать минуты и секунды в отсутствие.

В настоящее время он не учитывает север/юг, восток/запад. Если вы скажете мне, как бы вы хотели, чтобы с ними обращались, я обновлю ответ.

# -*- coding: latin-1 -*-
import re

PATTERN = re.compile(r"""(?P<lat_deg>\d+)°      # Latitude Degrees
                         (?:(?P<lat_min>\d+)')? # Latitude Minutes (Optional)
                         (?:(?P<lat_sec>\d+)")? # Latitude Seconds (Optional)
                         (?P<north_south>[NS])  # North or South
                         ,[ ]
                         (?P<lon_deg>\d+)°      # Longitude Degrees
                         (?:(?P<lon_min>\d+)')? # Longitude Minutes (Optional)
                         (?:(?P<lon_sec>\d+)")? # Longitude Seconds (Optional)
                         (?P<east_west>[EW])    # East or West
                      """, re.VERBOSE)

LAT_FIELDS = ("lat_deg", "lat_min", "lat_sec")
LON_FIELDS = ("lon_deg", "lon_min", "lon_sec")

def parse_dms_string(s, out_type=float):
    """
    Convert a string of the following form to a tuple of out_type latitude, longitude.

    Example input:
    0°25'30"S, 91°7'W
    """
    values = PATTERN.match(s).groupdict()

    return tuple(sum(out_type(values[field] or 0) / out_type(60 ** idx) for idx, field in enumerate(field_names)) for field_names in (LAT_FIELDS, LON_FIELDS))


INPUT = """0°25'30"S, 91°7'W"""

print parse_dms_string(INPUT) # Prints: (0.42500000000000004, 91.11666666666666)
person Jon-Eric    schedule 01.06.2012
comment
Спасибо. Позвольте мне посмотреть, что я могу сделать с этим, как есть. - person Darwin Tech; 01.06.2012

Простой подход (учитывая, что только сегодня я изучил регулярные выражения из-за этой проблемы). Работает с отсутствующими полями и направлениями компаса.

# -*- coding: latin-1 -*-
import re
s = """0°25'30"S, 91°7'W"""

def compLat_Long(degs, mins, secs, comp_dir):
    return (degs + (mins / 60) + (secs / 3600)) * comp_dir

def extract_DegMinSec(data):   
    m = re.search(r'(\d+°)*(\d+\')*(\d+")*', data.strip())
    deg, mins, secs = [0.0 if m.group(i) is None else float(m.group(i)[:-1]) for i in range(1, 4)]
    comp_dir = 1 if data[-1] in ('W', 'S') else -1
    return deg, mins, secs, comp_dir 

s1, s2 = s.split(',')
dms1 = extract_DegMinSec(s1)
dms2 = extract_DegMinSec(s2)
print('{:7.4f}  {:7.4f}'.format(compLat_Long(*dms1), compLat_Long(*dms2)))

урожаи

 0.4250  91.1167
person Levon    schedule 02.06.2012

Вы можете использовать функцию clean_lat_long() из библиотеки DataPrep, если ваши данные находятся в DataFrame. Установите DataPrep с помощью pip install dataprep.

from dataprep.clean import clean_lat_long
df = pd.DataFrame({"coord": ["""0°25'30"S, 91°7'W""", """27°29'04.2"N   89°19'44.6"E"""]})

df2 = clean_lat_long(df, "coord", split=True)
# print(df2)
                        coord  latitude  longitude
0           0°25'30"S, 91°7'W   -0.4250   -91.1167
1  27°29'04.2"N\t89°19'44.6"E   27.4845    89.3291
person victoria55    schedule 23.02.2021