Kontorsproblem, hitta en bättre lösning.

Permalänk
Medlem

Kontorsproblem, hitta en bättre lösning.

Hej,

Osäker på hur jag ställer min fråga, ställ gärna följdfrågor om nedan är oklart. Vill göra det klar att jag är okunnig/novis på samtliga programmeringsspråk, men har intresse och nu kanske ett litet projekt framför mig för att kunna lära mig.

Jag har stött på ett problem, eller en process i mitt arbetsflöde som det finns potential att göra smidigare och snabbare. Frågan jag nu sitter med är hur.

Vi får in filer med datasets automatiskt skapade. Dessa innehåller log-filer för den produkt vi arbetar med. Jag har då jag kikat närmare på detta insett att de inte är "kompletta". De kommer definierade som .json filer men min förståelse är att de inte är komplett .json (stötte på problem då jag försökte importera dem till excel t.ex.)

Loggarna vi får in innehåller ibland några hundra till 2-3 tusen rader som mest och följer följande format, dock med fler parametrar per rad:

{data1 123123, data2 123123, data3 123123, data4 123123, data5 123123} {data1 123123, data2 123123, data3 123123, data4 123123, data5 123123} {data1 123123, data2 123123, data3 123123, data4 123123, data5 123123}

Då det rör sig om större datamängder och ibland är delar av datan intressant, ibland annat. Det är somsagt log-filer som används för att diagnostisera problem, vilka skiljer sig åt.

Lösningen jag kommit fram till än så länge är att i notepad lägga all data inom [] samt köra en ersätt "} med }," för att excel sedan ska kunna läsa in datan som .json och parsas genom power query. Power query importen är automatiserad i den mån att den läser av .json filer i en specifik mapp för att sedan parsa det i en excel tabell.

Något av ett hobbyprojekt, motivation för att lära sig något programmeringsspråk/funktioner som kan vara bra att ha i framtiden.

Satte mig i fredags och börjad googla runt på olika sätt att hantera detta på, inte bara att automatiskt "rätta" .json formateringen utan att automatisera det hela vägen utifrån vilka parametrar man är intresserad av, tänker mig 2-3 olika pre-sets och de få gånger annat är intressant går det att göra det manuellt som tidigare.

Det jag hittat och laborerat lite smått med (utan att få det att fungera speciellt bra) är python med hjälp av pandas.

Jag letar inte heller efter en komplett lösning på mina bekymmer, men snarare kanske vägledning i hur man kan tackla problemet, jag kan tillräckligt om programmering rent generellt för att se detta som fullt möjligt. Men vart ska man starta? Några pointers? Förslag på programmeringsspråk/funktioner som man kan kolla på?

Målet är att t.ex. kunna presentera delar av datan grafiskt i diagram och tabeller.

Mvh,

Permalänk
Medlem

Är det ett stavfel, eller saknar raderna även colon mellan nyckel och värde?

JSON brukar normalt sett se ut så här: { data: "värde" }

Eller så är det en typ av JSON standard jag inte stött på tidigare.

Det du har presenterat i alla fall ser ut som att man har pushat in data, dvs en logg på ny rad, därför saknar man komma-tecken och [ i början och ] i slutet av filen. Det sista är lätt att förså varför, men i alla fall.

Tekniskt sett så borde man kunna rätta till datat med att bara sätta ett komma-tecken i slutet av varje rad, sedan lägga till [ i början och ] i slutet av filen.

Det borde vara hyfsat enkelt att lösa tekniskt sett.

Permalänk
Medlem

Det är som ShinyChrome säger inte riktig json utan någon typ av derivat eller struct baserad loggning.
Dock så ser datan välstrukturerad ut så är enkelt att fixa med Python.

Om man sen vill köra något mer GUI aktigt och hålla på med transforms och flöden så finns ju alltid Apache Nifi.

Skulle nog själv skrivit en liten app i Python som skyfflar in data i Graphite/Influxdb och som sen presenteras med Grafana.

Visa signatur

Ei bor i stockholm och tar inget ansvar för allt som han säger
7900, 64 gig ram, radeon r290
Solna arbetscenter