numpy 배열에서 특정 열 추출
이것은 쉬운 질문이지만 MxN 행렬이 있다고 말합니다. 내가 원하는 것은 특정 열을 추출하여 다른 numpy 배열에 저장하는 것이지만 잘못된 구문 오류가 발생합니다. 코드는 다음과 같습니다.
extractedData = data[[:,1],[:,9]].
위의 줄로 충분할 것 같지만 그렇지 않습니다. 나는 둘러 보았지만이 특정 시나리오와 관련하여 현명한 구문을 찾을 수 없었습니다.
나는 당신이 열을 원한다고 가정 1
하고 9
? 그게
data[:, [1, 9]]
또는 이름으로 :
data[:, ['Column Name1','Column Name2']]
당신은에서 이름을 얻을 수 있습니다 data.dtype.names
...
해당 코드 스 니펫으로 열 1과 9를 얻으려는 경우 다음과 같아야합니다.
extractedData = data[:,[1,9]]
일부 열만 추출하려는 경우 :
idx_IN_columns = [1, 9]
extractedData = data[:,idx_IN_columns]
특정 열을 제외하려는 경우 :
idx_OUT_columns = [1, 9]
idx_IN_columns = [i for i in xrange(np.shape(data)[1]) if i not in idx_OUT_columns]
extractedData = data[:,idx_IN_columns]
다만:
>>> m = np.matrix(np.random.random((5, 5)))
>>> m
matrix([[0.91074101, 0.65999332, 0.69774588, 0.007355 , 0.33025395],
[0.11078742, 0.67463754, 0.43158254, 0.95367876, 0.85926405],
[0.98665185, 0.86431513, 0.12153138, 0.73006437, 0.13404811],
[0.24602225, 0.66139215, 0.08400288, 0.56769924, 0.47974697],
[0.25345299, 0.76385882, 0.11002419, 0.2509888 , 0.06312359]])
>>> m[:,[1, 2]]
matrix([[0.65999332, 0.69774588],
[0.67463754, 0.43158254],
[0.86431513, 0.12153138],
[0.66139215, 0.08400288],
[0.76385882, 0.11002419]])
열이 순서대로 정렬 될 필요는 없습니다.
>>> m[:,[2, 1, 3]]
matrix([[0.69774588, 0.65999332, 0.007355 ],
[0.43158254, 0.67463754, 0.95367876],
[0.12153138, 0.86431513, 0.73006437],
[0.08400288, 0.66139215, 0.56769924],
[0.11002419, 0.76385882, 0.2509888 ]])
내가 지적하고 싶은 한 가지는 추출하려는 열의 수가 1 인 경우 결과 행렬 은 예상대로 Mx1 행렬 이 아니라 대신 추출한 열의 요소를 포함하는 배열입니다.
이를 Matrix로 변환하려면 결과 배열에 reshape (M, 1) 메소드를 사용해야합니다.
다음과 같은 목록을 사용하여 ND 배열에서 열을 선택할 때주의해야 할 사항이 하나 더 있습니다.
data[:,:,[1,9]]
예를 들어 하나의 행만 선택하여 차원을 제거하는 경우 결과 배열은 (어떤 이유로 든) 치환 됩니다. 그래서:
print data.shape # gives [10,20,30]
selection = data[1,:,[1,9]]
print selection.shape # gives [2,20] instead of [20,2]!!
당신이 사용할 수있는 :
extracted_data = data.ix[:,['Column1','Column2']]
나는 여기서 해결책이 더 이상 파이썬 버전의 업데이트와 함께 작동하지 않는다고 생각합니다. 새로운 파이썬 함수로 그것을 수행하는 한 가지 방법은 다음과 같습니다.
extracted_data = data[['Column Name1','Column Name2']].to_numpy()
원하는 결과를 제공합니다.
The documentation you can find here: https://pandas.pydata.org/pandas-docs/stable/reference/api/pandas.DataFrame.to_numpy.html#pandas.DataFrame.to_numpy
you can also use extractedData=data([:,1],[:,9])
참고URL : https://stackoverflow.com/questions/8386675/extracting-specific-columns-in-numpy-array
'Programing' 카테고리의 다른 글
Windows / IIS 서버에서 현재 페이지의 전체 URL을 얻으려면 어떻게해야합니까? (0) | 2020.06.23 |
---|---|
HTML.BeginForm 및 속성 추가 (0) | 2020.06.23 |
숫자 인덱스로 data.table에서 여러 열을 선택하십시오. (0) | 2020.06.23 |
Java SE와 Java EE의 주요 차이점은 무엇입니까? (0) | 2020.06.23 |
Internet Explorer 8은 HTML 5를 지원합니까? (0) | 2020.06.23 |