Kontorsproblem, hitta en bättre lösning.
Hej,
Osäker på hur jag ställer min fråga, ställ gärna följdfrågor om nedan är oklart. Vill göra det klar att jag är okunnig/novis på samtliga programmeringsspråk, men har intresse och nu kanske ett litet projekt framför mig för att kunna lära mig.
Jag har stött på ett problem, eller en process i mitt arbetsflöde som det finns potential att göra smidigare och snabbare. Frågan jag nu sitter med är hur.
Vi får in filer med datasets automatiskt skapade. Dessa innehåller log-filer för den produkt vi arbetar med. Jag har då jag kikat närmare på detta insett att de inte är "kompletta". De kommer definierade som .json filer men min förståelse är att de inte är komplett .json (stötte på problem då jag försökte importera dem till excel t.ex.)
Loggarna vi får in innehåller ibland några hundra till 2-3 tusen rader som mest och följer följande format, dock med fler parametrar per rad:
{data1 123123, data2 123123, data3 123123, data4 123123, data5 123123}
{data1 123123, data2 123123, data3 123123, data4 123123, data5 123123}
{data1 123123, data2 123123, data3 123123, data4 123123, data5 123123}
Då det rör sig om större datamängder och ibland är delar av datan intressant, ibland annat. Det är somsagt log-filer som används för att diagnostisera problem, vilka skiljer sig åt.
Lösningen jag kommit fram till än så länge är att i notepad lägga all data inom [] samt köra en ersätt "} med }," för att excel sedan ska kunna läsa in datan som .json och parsas genom power query. Power query importen är automatiserad i den mån att den läser av .json filer i en specifik mapp för att sedan parsa det i en excel tabell.
Något av ett hobbyprojekt, motivation för att lära sig något programmeringsspråk/funktioner som kan vara bra att ha i framtiden.
Satte mig i fredags och börjad googla runt på olika sätt att hantera detta på, inte bara att automatiskt "rätta" .json formateringen utan att automatisera det hela vägen utifrån vilka parametrar man är intresserad av, tänker mig 2-3 olika pre-sets och de få gånger annat är intressant går det att göra det manuellt som tidigare.
Det jag hittat och laborerat lite smått med (utan att få det att fungera speciellt bra) är python med hjälp av pandas.
Jag letar inte heller efter en komplett lösning på mina bekymmer, men snarare kanske vägledning i hur man kan tackla problemet, jag kan tillräckligt om programmering rent generellt för att se detta som fullt möjligt. Men vart ska man starta? Några pointers? Förslag på programmeringsspråk/funktioner som man kan kolla på?
Målet är att t.ex. kunna presentera delar av datan grafiskt i diagram och tabeller.
Mvh,